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Figura  1:  Los  autores  fotografiados  en  su  visita  a  la  casa  de  Pablo  Neruda  en  Isla  Negra,  en 
abril  de  2011. 

Este  libro  tuvo  su  origen  en  un  viaje  en  tren  entre  Cartagena  y  Madrid,  cuando  los 
dos  autores  volvíamos  de  una  tesis  doctoral  en  la  ciudad  de  origen,  allá  por  marzo  de  2009. 
Mientras  disfrutábamos  contemplando  los  paisajes  que  en  su  día  viera  Don  Quijote  y  mientras 
hablábamos  de  lo  humano  y  lo  divino,  se  nos  ocurrió  escribir  este  texto.  Nuestra  idea  inicial 
fue  mostrar  la  estrecha  relación  que  existe  entre  dos  áreas  muy  activas  en  investigación, 
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al  método  de  Newton. 
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Prólogo 


Lo  primero  que  es  obligatorio  hacer,  es  alertar  al  lector  que  el  título  de  esta  obra  en  sí, 
conlleva  la  conjunción  de  dos  grandes  vertientes  de  las  matemáticas  modernas.  A  saber,  los 
sistemas  dinámicos  y  los  métodos  numéricos  para  encontrar  raíces  de  ecuaciones.  Ambas, 
ramas  de  la  matemática  de  fecundo  desarrollo  en  el  siglo  XX  e  inicio  de  este  nuevo  siglo  XXI. 

Así,  la  sola  escritura  de  un  libro  como  este,  no  resulta  ser  una  tarea  fácil.  Esto,  porque 
cada  una  de  estas  ramas  tiene  sus  particularidades.  Los  sistemas  dinámicos,  por  así  decirlo, 
son  la  matemática  de  la  intuición,  por  excelencia,  y  los  métodos  numéricos  vienen  del  análisis, 
por  origen.  Así,  introducirse  a  este  tema  requiere  de  las  dos  capacidades  que  se  han  enfrentado 
desde  siglos  en  matemática:  la  intuición  y  el  pensamiento  analítico. 

Pero,  no  es  tan  verdad  que  deban  siempre  enfrentarse.  Y  este  libro  aquí  es  un  ejemplo 
de  ello.  Pueden,  también,  complementarse,  como  se  complementaron  por  años  José  Manuel 
y  Sergio  en  su  trabajo  original  como  matemáticos.  Así  invito  al  virtual  lector,  a  introducirse 
en  esta  obra  para  que  conozca  como  se  hace  esto  de  mezclar  los  sistemas  dinámicos  con  los 
métodos  numéricos. 

El  primer  capítulo  es  una  breve  introducción  a  los  sistemas  dinámicos.  Al  lector  no  familia¬ 
rizado  le  recomiendo  rehacer  las  cuentas,  sobre  todo  lo  relacionado  con  la  familia  cuadrática, 
porque  con  ello  empezará  a  sentir  el  «sabor»  del  tipo  de  problema  que  se  aborda  en  dinámica. 

El  segundo  capítulo  introduce  el  método  de  Newton,  su  historia,  entrega  una  idea  de  sus 
generalizaciones  y  se  concentra  en  él,  su  convergencia  y  diversas  aplicaciones.  Al  leerlo,  uno 
se  da  cuenta  de  cuál  es  el  tipo  de  problema  que  se  quiere  abordar  con  estas  técnicas,  como 
se  hace  y  como  se  aplican. 

Ya  el  capítulo  tres  trata  una  introducción  el  tema  principal  del  libro:  la  dinámica  del 
método  de  Newton  y  lo  hace  en  el  primer  lugar  donde  se  debe  ver,  la  recta  real.  Así,  se  estudia 
la  dinámica  de  la  transformación  de  Newton  en  al  ámbito  del  conjunto  de  los  números  reales 
y  se  completa  el  capítulo  con  las  bifurcaciones  del  referido  método.  Para  este  capítulo  ya 
se  hace  necesario  algún  mejor  dominio  de  la  matemática.  Digamos:  un  curso  bien  hecho  de 
introducción  al  análisis  real;  otro  de  álgebra  intermedia,  algo  de  polinomios,  álgebra  lineal  y 
un  poco  de  topología. 

El  capítulo  cuatro,  que  trata  sobre  la  dinámica  del  método  de  Newton  en  el  campo  de 
los  números  complejos,  es  la  parte  más  compleja  del  libro  y  tiene  que  ver  con:  una  breve 
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introducción  a  la  dinámica  compleja;  el  estudio  del  método  de  Newton  aplicado  a  polinomios 
de  grado  2,  3,  4  y  5  y  la  determinación  de  algoritmos  generalmente  convergentes  para  poli¬ 
nomios  complejos.  Esta  última  parte  tiene  que  ver  con  desarrollos  relativamente  recientes  y 
requerirá  mayor  concentración  del  lector.  En  todo  caso,  hay  una  rica  bibliografía  que  puede 
ayudar  a  comprender  de  mejor  manera  esta  última  parte. 

El  libro  concluye  con  un  «cogollo»  estético  sobre  comportamiento  dinámico  de  polinomios 
y  sus  subyacentes  conjuntos  de  Julia,  de  Mandelbrot  y  la  sorprendente  relación  que  dice  que 
conjuntos  de  Julia  llenos  de  polinomios  cuadráticos,  aparecen  como  parte  del  conjunto  de 
Fatou  del  método  de  Newton  aplicados  a  polinomios  cúbicos.  Concluye  la  obra  mostrando  el 
fractal  de  Chicho  (Chicho  es  el  sobrenombre  del  matemático  español  José  Javier  Guadalupe 
(1945-2000)),  que  puede  obtenerse  jugando  con  una  modificación  de  la  función  de  iteración 
asociada  al  conjunto  de  Mandelbrot  del  polinomio  cuadrático  z2  +  c. 

En  fin,  damos  la  bienvenida  a  este  libro  que  resulta  ser  un  lugar  para  aprender  y  entrete¬ 
nerse,  para  quien  quiera  hacerlo. 


Dr.  Rafael  Labarca  B. 
Profesor  de  Matemática 
Universidad  de  Santiago  de  Chile 


Santiago  de  Chile,  6  de  mayo  de  2013 
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Capítulo  1 

Sistemas  dinámicos  discretos 


1.1.  Introducción 

Una  parte  de  la  teoría  de  los  sistemas  dinámicos  se  dedica  a  estudiar  el  comportamiento 
de  las  iteraciones  sucesivas  de  una  función  en  términos  de  los  diferentes  puntos  iniciales. 

El  problema  de  determinar  la  conducta  de  los  iterados  de  una  función  aparece  frecuen¬ 
temente  en  algunos  estudios  naturales,  como  por  ejemplo  en  la  dinámica  de  poblaciones.  El 
objetivo  de  este  tipo  de  problemas  es  determinar  el  número  de  individuos  x(t)  de  una  deter¬ 
minada  población  como  función  del  tiempo  t.  Una  aproximación  a  este  problema,  debida  al 
economista  inglés  Thomas  R.  Malthus  («Primer  ensayo  de  la  población»,  1798),  consiste  en 
asumir  que  existe  una  tasa  de  nacimiento  constante  b,  lo  cual  significa  que  en  una  población 
de  x  individuos  podemos  esperar  que  bx  nuevos  individuos  nazcan  en  el  transcurso  de  una 
unidad  de  tiempo.  Esto  puede  ser  formulado  como  una  ecuación  en  diferencias  finitas 

xn+i  =  xn  +  bxn  =  (1  +  b)xn, 

donde  xn  es  la  población  en  el  tiempo  n.  Iterando  esta  relación  obtenemos  la  expresión 

xn  =  ( 1  +  b)nx  o 

como  predicción  de  la  población,  donde  xq  es  la  población  inicial. 

Frecuentemente,  se  supone  que  la  población  sigue  una  evolución  continua,  de  modo  que 
idealmente  las  mediciones  xn  serán  tomadas  en  intervalos  pequeños  de  longitud  h.  Esto  lleva 
a  la  ecuación  de  diferencias 


x((n  +  1  )h)  —  x(nh )  =  bhx(nh). 


Escribiendo  x(t)  como  función  de  t  =  nh,  y  reordenando,  obtenemos 


x\t) 


,,  x(t  +  h)  —  x(t) 

lim - - - 

h — >0  h 


bx(t). 
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Como  vemos,  la  ecuación  en  diferencias  anterior  se  aproxima  a  la  ecuación  diferencial 

x\t)  =  bx{t), 

conocida  como  ecuación  diferencial  de  crecimiento  exponencial.  La  solución  de  esta  ecuación 
es  la  función  exponencial 

x(t)  =  x0ebt. 

En  este  caso,  las  versiones  discreta  y  continua  de  este  sistema  dinámico  se  comportan  más 
o  menos  de  la  misma  forma. 

Nótese  que  en  el  modelo  anterior  no  hemos  considerado  la  tasa  de  mortalidad.  Podemos 
asumir  que  ésta  es  proporcional  a  la  población  existente  en  cada  momento  dado.  Esto  nos 
lleva  otra  vez  a  la  ecuación  de  diferencias  de  crecimiento  exponencial  si  la  tasa  de  nacimientos 
excede  a  la  tasa  de  muertes,  o  al  decaimiento  exponencial  si  ocurre  lo  opuesto.  Sin  embargo, 
uno  puede  suponer  que  la  tasa  de  muerte  es  proporcional  al  número  de  encuentros  entre 
individuos.  Esto  es,  cuanto  más  y  más  individuos  entren  en  contacto  unos  con  otros,  un  mayor 
porcentaje  de  individuos  muere.  Esta  es  la  base  del  conocido  como  modelo  de  Verhulst,  que 
en  su  versión  continua  da  lugar  a  la  ecuación  diferencial 

x'(t)  =  bx(t)  —  dx2{t), 

también  conocida  como  ecuación  logística,  y  cuya  solución  es 


dx  o  +  (b  —  dx  o)e~bt 

Obsérvese  que  las  muertes  decaen  exponencialmente  a  0  cuando  t  — »  oo.  Por  lo  tanto,  este 
modelo  predice  una  población  límite  de  b/d  individuos,  independiente  de  la  población  inicial. 

La  expresión,  relativamente  sencilla,  de  la  función  logística  no  hace  sospechar  que  esconda 
una  riqueza  dinámica  extraordinaria.  Por  ejemplo,  una  variante  de  la  función  logística  en  su 
versión  discreta, 

xn+1  =  (1  +  b)xn  -  dx2n 

fue  empleada  por  el  biólogo  Robert  May  en  1976  para  estudiar  el  crecimiento  de  una  población 
de  insectos  [97].  May  constató  que  el  modelo  así  obtenido  podía  presentar  comportamientos 
muy  variados,  como  vemos  en  el  siguiente  ejemplo. 

Ejemplo  1.1.  Analícese  el  comportamiento  de  la  sucesión 

Xn_|_i  CXn(  1  Xff) 

para  distintos  valores  del  parámetro  c,  considerando  en  todos  los  casos  el  mismo  punto  de 
partida:  x0  =  0.1. 
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Para  c  =  0.75  la  sucesión  {. xn }  converge  a  0.  Para  c  =  2.5  la  sucesión  {xn}  converge 
a  0.6.  Para  c  =  3.2,  y  a  partir  de  un  cierto  valor  de  n,  se  observa  que  la  sucesión 
{xn}  va  tomando  los  valores  0.513045  y  0.799455.  Sin  embargo,  para  c  =  3.5  esta 
tendencia  repetitiva  ha  aumentado  a  cuatro  términos:  0.38280,  0.826941,  0.500884 
y  0.874997.  Por  último  para  c  =  3.8  los  términos  de  la  sucesión  anterior  no  siguen 
ningún  orden  aparente.  Presentan,  por  tanto,  un  comportamiento  caótico. 


1.2.  Conceptos  básicos 

En  esta  sección  presentamos  algunos  de  los  conceptos  básicos  de  la  dinámica  de  funcio¬ 
nes  escalares.  Sólo  consideramos  los  resultados  que,  a  nuestro  juicio  nos  han  parecido  más 
relevantes  o  que  vayamos  a  utilizar  en  secciones  posteriores.  Existe  una  extensa  bibliografía 
que  permite  profundizar  más  en  este  apartado.  A  modo  de  ejemplo,  se  pueden  consultar  los 
textos  [3,  43,  57,  66,  69,  94,  127,  126,  141]  y  algunos  artículos  [91,  97,  144], 

La  primera  definición  hace  referencia  a  lo  que  se  entiende  por  un  sistema  dinámico  discreto. 

Definición  1.1.  Un  sistema  dinámico  discreto  es  un  par  (X, /)  formado  por  un  espacio 
métrico  X  y  una  función  f  :  X  — >  X . 

En  esta  sección  nos  centramos  en  el  caso  de  que  el  espacio  métrico  X  es  el  conjunto 
M  de  los  números  reales.  No  obstante,  muchas  de  las  definiciones  y  conceptos  que  vamos 
a  introducir  aquí  se  pueden  extender  de  forma  natural  a  otros  espacios  como  los  números 
complejos  Coa  los  espacios  Mn  con  n  >  1.  Del  mismo  modo,  en  un  principio,  sólo  requerimos 
que  las  funciones  sean  continuas,  aunque  también  se  pueden  obtener  resultados  específicos 
cuando  se  trabaja  con  funciones  derivables. 

Sea  /  :  /  — >  M  una  función  continua  definida  en  un  intervalo  í  C  1.  En  lo  que  sigue  fn 
denotará  la  composición  de  /  con  sí  misma  n  veces,  es  decir, 

fn  ~  f  o  f  o  •••  o  f 

S - - - V* - / 

n  veces 

cuando  esta  composición  tenga  sentido. 

Definición  1.2.  Sea  p  e  I.  Si  las  sucesivas  imágenes  de  p,  f(p),f2(p),f3(p),---,  están 
definidas,  se  define  la  órbita  de  p  como  el  conjunto 

orb  (p)  =  { p ,  f(p),  f2(p), ...,  fn(p ), . . .  }. 

La  teoría  de  los  sistemas  dinámicos  trata  de  analizar  el  comportamiento  de  orb  (jo)  para 
diferentes  valores  de  p  €  I.  En  una  primera  clasificación  de  las  órbitas  podemos  distinguir 
aquéllas  que  se  acercan  a  un  cierto  valor  o  las  que  presentan  un  comportamiento  periódi¬ 
co.  Desde  el  punto  de  vista  dinámico,  tal  vez,  las  más  interesantes  resulten  las  órbitas  no 
periódicas  y  que  puedan  dar  lugar  a  un  comportamiento  caótico. 
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Comenzamos  definiendo  los  elementos  más  simples  en  el  estudio  de  los  sistemas  dinámicos 
discretos:  los  puntos  fijos  y  los  puntos  periódicos. 

Definición  1.3.  Sea  p  G  I.  Decimos  que 

(a)  p  es  un  punto  fijo  de  f  si  f(p)  =  p. 

(b)  p  es  un  punto  periódico  de  período  k  si,  fk(p )  =  p  y  f3  (p)  p  para  1  <  j  <  k  —  1. 

(c)  Nos  referiremos  a  la  órbita  periódica  de  un  punto  periódico  de  período  k  como  un  k- 

ciclo. 

A  continuación  hacemos  algunas  observaciones  interesantes  acerca  de  esta  definición. 

(i)  Los  puntos  fijos  de  /  son  aquéllos  en  donde  su  gráfico  intersecta  a  la  línea  y  =  x. 

(ii)  Los  puntos  periódicos  de  período  k  >  2  de  /  son  los  puntos  fijos  de  fk  que  no  son 
puntos  fijos  de  / 3  para  1  <  j  <  k  —  1. 

(iii)  Si  p  es  un  punto  periódico  de  /  entonces  su  órbita  es  finita.  En  este  caso,  el  número  de 
elementos  en  orb(p)  es  su  período. 

Ejemplo  1.2.  Para  f  :  M  — >  M,  f(x )  =  — x 3,  x0  =  0  es  un  punto  fijo  y  x i  =  1  es  un  punto 
periódico  de  período  2. 

Aunque  existe  una  gran  variedad  de  resultados  que  garantizan  la  existencia  de  puntos  fijos 
de  una  función  bajo  distintas  suposiciones,  los  siguientes  teoremas,  son  quizás  los  más  ele¬ 
mentales  sobre  existencia  de  puntos  fijos.  Omitimos  su  demostración,  que  es  una  consecuencia 
inmediata  del  teorema  del  valor  intermedio  (véase  [80]). 

Teorema  1.1.  Sean  I  =  [a,  b]  un  intervalo  cerrado  y  f  :  I  — >  M  una  aplicación  continua  tal 
que  f(I)  I  ó  I  /(/)■  Entonces  f  tiene  un  punto  fijo  en  I . 

Ejemplo  1.3.  La  función  f(x)  =  1  —  x2  definida  en  el  intervalo  I  =  [0, 1]  satisface  las 
condiciones  del  teorema  1.1. 

En  efecto,  notemos  que  /(/)  =  /,  luego  /  tiene  un  punto  fijo  en  /.  En  este  caso, 
dicho  punto  fijo  es  fácil  de  encontrar.  Para  ello  tenemos  que  resolver  la  ecuación 
f{x)  =  x,  es  decir,  1  —  x2  =  x,  de  donde  xq  =  (—1  +  a/5)/2.  Notemos  que  existe 
otra  solución  de  la  ecuación  anterior,  pero  ésta  no  pertenece  al  intervalo  [0, 1]. 

Definición  1.4.  Sean  p  G  /  y  f  :  I  — >  R.  Decimos  que 

(a)  p  es  eventualmente  fijo  si  existe  N  tal  que  fn+1(p)  =  fn(p)  para  n  >  N. 
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(b)  p  es  eventualmente  periódico  con  período  k  si  existe  N  tal  que  fn+k(p)  =  fn(p )  para 
n  >  N .  En  otras  palabras,  fN  (p)  está  sobre  una  órbita  periódica. 

Notemos  que  p  es  un  punto  eventualmente  fijo  de  /  si  es  una  preimagen  de  un  punto  fijo. 
En  otras  palabras,  existe  un  punto  fijo  q  de  f  tal  que  p  G  Un>i  /_n(?),  donde 

r\q)  =  {x£l:  fk(x)  =  ,}. 

Ejemplo  1.4.  La  función  f(x)  =  |1  —  x\,  definida  para  seK,  tiene  un  punto  eventualmente 
fijo  en  p  =  3/2  y  un  punto  eventualmente  periódico  de  período  2  en  p  =  2. 

En  efecto,  como  /( 1/2)  =  1/2  y  /( 3/2)  =  1/2,  se  tiene  que  fn+l( 3/2)  =  fn( 3/2)  = 

1/2  si  n  >  1.  Por  otra  parte,  como  {0, 1}  es  una  órbita  periódica  de  período  2,  y 
como  /( 2)  =  1  se  sigue  que  2  es  eventualmente  periódico  de  período  2. 

Ejemplo  1.5.  La  función  f(x)  =  x3  tiene  un  punto  fijo  en  x  =  0.  Además,  los  puntos  en 
x  G  (—1, 1)  satisfacen  lím^oo  fn(x)  =  0  =  /(O)  ( véase  la  figura  1.1). 

Por  otra  parte,  la  función  f(x)  =  éjfx  también  tiene  un  punto  fijo  en  x  =  0.  Sin  embargo, 
la  órbita  de  cualquier  valor  x0  0,  se  aleja  de  0,  incluso  aunque  x0  esté  muy  próximo  a  0 
(véase  la  figura  1.1). 

Para  realizar  un  análisis  gráfico  de  la  órbita  de  un  punto  Xq  por  una  función  de  iteración 
f(x),  se  puede  proceder  de  la  siguiente  manera: 

1.  Representar  con  los  mismos  ejes  el  gráfico  de  la  función  y  =  f(x)  y  el  de  la  diagonal 
y  =  x. 

2.  Situar  el  punto  x0  en  ele  eje  de  abcisas  y  desplazarse  verticalmente  hasta  cortar  con  la 
gráfica  de  y  =  f(x),  obteniendo  un  punto  cuya  abcisa  es  f(x0). 

3.  A  partir  de  ese  punto,  desplazarse  horizontalmente  hasta  intersecar  la  diagonal  y  =  x. 

4.  Volver  a  desplazarse  verticalmente  hasta  encontrar  de  nuevo  la  gráfica  de  la  curva 
y  =  f(x).  Obtenemos  ahora  un  punto  cuya  abcisa  es  f(f(x o)). 

5.  Repetir  el  proceso  las  veces  que  se  consideren  oportunas. 

El  ejemplo  anterior  motiva  una  clasificación  de  los  puntos  fijos  atendiendo  a  su  carácter 
atractor  o  repulsor  respecto  a  las  órbitas  de  los  puntos  cercanos. 

Definición  1.5.  Sea  p  un  punto  fijo  de  f .  Decimos  que  p  es  un  atractor  si  existe  un  intervalo 
abierto  J  3  p  tal  que  para  cada  x  G  J,  lím)WOO  fn(x)  =  p. 

Por  el  contrario  decimos  que  p  es  un  repulsor  si  existe  un  intervalo  abierto  J  3  p  tal  que 
para  cada  x  G  J ,  x  p,  existe  k  G  N  tal  que  fk(x)  f  J . 
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Figura  1.1:  Análisis  gráfico  del  comportamiento  atractor  de  p  =  0  como  punto  fijo  de  f(x)  = 
x 3  y  del  comportamiento  repulsor  de  p  =  0  como  punto  fijo  de  f(x)  =  x1/3.  En  el  primer 
caso  se  muestra  cómo  la  órbita  del  punto  xq  =  0.9  converge  hacia  0,  mientras  que  en  el 
segundo  caso  se  muestra  cómo  la  órbita  del  punto  xo  =  0.1  se  «escapa»  del  0,  siendo  atraída 
por  otro  punto  fijo,  en  este  caso  p  =  1. 

Estas  definiciones  se  pueden  extender  a  los  puntos  periódicos  de  /.  En  concreto,  p  es  un 
punto  periódico  atractor  (repulsor)  de  /  si  y  sólo  si  p  es  un  punto  fijo  atractor  (repulsor)  de 
fk,  siendo  k  el  período  de  p. 

Nótese  que  hay  puntos  fijos  que  no  son  ni  atractores  ni  repulsores.  Por  ejemplo  p  =  0  es 
un  punto  fijo  de  f(x)  =  x  +  x2.  Si  xo  E  [—1, 0]  la  órbita  de  Xo  converge  a  0.  Si  xo  ^  [—1,  0], 
su  órbita  es  divergente  a  oo. 

Definición  1.6.  Sea  p  un  punto  fijo  de  f.  La  cuenca  de  atracción  de  p  es  el  conjunto 
B(p)  =  {x  :  fn(x)  — >  p,  cuando  n  — >  oo}. 

La  cuenca  de  atracción  inmediata  de  p  es  la  componente  conexa  de  B(p)  que  contiene  a  p. 

Definición  1.7.  Sea  p  un  punto  periódico  de  período  k  de  f .  La  cuenca  de  atracción  de  p  es 
B(p)  =  {x  :  fnk(x)  — *  p,  cuando  n  — >  oo}. 

La  cuenca  de  atracción  de  la  órbita  de  p,  es  ¿3(orb(p))  =  (Jp¡o  P{B{p))  =  Uj=o  ^UKp))- 
La  cuenca  de  atracción  inmediata  de  la  órbita  de  p  es  la  unión  de  las  componentes  conexas 
que  contienen  los  puntos  de  la  órbita  de  p. 

Es  claro  que  si  p  es  un  punto  periódico  atractor  de  /,  entonces  tanto  B(p)  como  B(orh(p)) 
son  conjuntos  abiertos.  Esto  no  ocurre  para  puntos  fijos  no  atractores. 

Por  ejemplo,  para  /(x)  =  — x3,  el  punto  p  =  0  es  un  punto  fijo  atractor,  y  ¿3(0)  =  (—1, 1). 
Por  otra  parte,  para  /(x)  =  x  +  x2,  el  punto  p  —  0  es  un  punto  fijo  no  atractor,  y  ¿3(0)  = 
[—1,0],  el  cual  no  es  abierto. 
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Teorema  1.2.  Las  cuencas  de  atracción  de  puntos  periódicos  distintos  no  se  intersecan. 

Quizás  los  resultados  más  sorprendentes  en  dinámica  uno  dimensional,  con  la  sola  hipótesis 
de  continuidad  son  los  siguientes  (véase  [43],  [91]). 

Teorema  1.3  (Li  y  Yorke).  Si  una  función  continua  f  :  I  — >  M  tiene  un  punto  periódico  de 
período  tres,  entonces  f  tiene  puntos  periódicos  de  todos  los  períodos. 

Ejemplo  1.6.  Considérese  la  función  f(x )  =  (—3a;2  +  5a;  +  2)/2.  Como  /(O)  =  1,  /( 1)  =  2 
y  fifi)  =  0,  se  tiene  que  {0, 1,2}  forma  una  órbita  periódica  de  período  3.  En  consecuencia, 
por  el  teorema  de  Li  y  Yorke,  f  tiene  puntos  periódicos  de  todos  los  períodos. 

Definición  1.8.  El  orden  de  Sarkovskii  de  los  números  naturales  es: 

3y5y7y9> - >-  2o  •  (2n  +  1)  > - 

•  •  •  >-  2  •  3  >-  2  •  5  >-  2  •  7  >-  2  •  9  > - >-  21  •  (2n  +  1)  > - 

•  •  •  >-  22  •  3  >-  22  •  5  >-  22  •  7  >-  22  •  9  > - >-  22  •  (2n  +  1)  > - 

•  •  •  >-  2n+1  y2n> - >-  23  >-  22  >-  2  >-  1, 

donde  n  >-  m  significa  que  n  precede  a  m  en  el  orden. 

Teorema  1.4  (Sarkovskii).  Supongamos  que  f  :  M  — >  M  es  continua  y  que  f  tiene  un  punto 
periódico  con  período  n.  Si  n  >-  m  en  el  orden  de  Sarkovskii,  entonces  se  prueba  que  f  tiene 
un  punto  periódico  con  período  m. 

Ahora,  en  lo  que  sigue  asumiremos  que  las  funciones  en  cuestión  son  al  menos  cliferen- 
ciables.  En  este  caso,  se  pueden  dar  caracterizaciones  de  los  puntos  fijos  de  una  función  en 
términos  de  su  derivada. 

Teorema  1.5.  Sea  I  un  intervalo  cerrado.  Si  f  :  I  — >  I  es  diferenciable  y  satisface  |//(a;)|  <  1 
para  todo  x  €  I,  entonces  f  tiene  un  único  punto  fijo  en  I . 

Demostración.  Inmediata  a  partir  del  teorema  del  valor  medio.  □ 

Supongamos  que  /  es  de  clase  C1(J),  es  decir,  derivadle  en  /  y  con  la  función  derivada 
continua.  Sea  p  un  punto  fijo  de  /  contenido  en  el  intervalo  /.  El  carácter  de  la  derivada 
de  /  en  p  nos  proporciona  información  sobre  el  punto  fijo.  Notemos  que  si  \f'(p)\  <  1, 
entonces  existe  un  intervalo  abierto  U  C  /  con  p  e  7/,  tal  que  para  cada  x  G  U  se  tiene 
lím^oo  fn(x)  =  p.  En  consecuencia  U  C  B(p). 

Sin  embargo,  si  \f'(p)\  >  1  existe  un  intervalo  abierto  conteniendo  a  p  tal  que  todos  los 
puntos  de  ese  intervalo,  diferentes  del  punto  p,  salen  del  intervalo  bajo  iteraciones  por  /. 

Estas  observaciones  están  en  la  base  del  siguiente  resultado  que  caracteriza  los  puntos 
fijos  de  una  función  en  términos  de  su  derivada. 
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Teorema  1.6.  Sea  f  :  I  — >  M  una  función  de  clase  Cl(I)  y  sea  p  un  punto  fijo  de  f . 

1.  Si  \f'(p)\  <  1,  entonces  p  es  un  punto  fijo  atractor  de  f . 

2.  Si  \  f\p)\  >  1,  entonces  p  es  un  punto  fijo  repulsor. 

Definición  1.9.  Sea  f  una  función  derivable  en  un  entorno  de  un  punto  fijo  p.  Decimos  que 
p  es  un  punto  fijo  indiferente  (o  neutro)  de  f  si  \f'(p)  \  =  1. 

Además  decimos  que  p  es  un  punto  periódico  indiferente  (o  neutro)  de  f  si  p  es  un  punto 
fijo  indiferente  (o  neutro)  de  fk,  siendo  k  el  período  de  p. 

Notemos  qne  cuando  p  es  un  punto  fijo  atractor,  el  valor  \f'(p)\  proporciona  información 
sobre  la  velocidad  de  convergencia  de  las  órbitas  orb(a;)  para  puntos  x  cercanos  a  p.  Cnanto 
menor  sea  \f'(p)\,  más  rápida  será  dicha  convergencia.  En  concreto,  si  f'(p )  =  0,  se  dice  qne 
p  es  un  punto  fijo  superatractor. 

Ejemplo  1.7.  Estudiemos  el  carácter  de  x  =  0  como  punto  fijo  de  las  siguientes  funciones: 

f(x)  =  x 3,  f{x )  =  \/x,  f(x)  =  x  —  x3,  f(x)  =  x  +  x3  y  f(x)  =  x  +  x2. 

En  el  primer  caso,  /'(O)  =  0,  Inego  x  =  0  es  un  punto  fijo  superatractor. 

Sin  embargo,  para  la  función  f(x)  =  -yór,  límx_*0  f(x)  =  oo,  lnego  x  =  0  es  un 
punto  fijo  repulsor. 

Es  inmediato  comprobar  qne  para  las  funciones  f(x)  =  x  —  x3,  f{x)  =  x  +  x3 
y  f(x)  =  x  +  x2  se  tiene  /'(O)  =  1,  lnego  se  trata  de  un  punto  fijo  indiferente. 

Sin  embargo,  en  el  primer  caso,  el  punto  fijo  tiene  un  carácter  atractor,  en  el 
segundo  caso  el  punto  fijo  es  repulsor  y  en  el  tercer  caso  el  punto  fijo  tiene  un 
carácter  atractor  para  las  órbitas  de  puntos  x  e  [—1,0],  mientras  qne  el  carácter 
es  repulsor  para  las  órbitas  de  puntos  x  >  0. 

Como  vemos  en  el  caso  de  los  puntos  fijos  indiferentes,  el  comportamiento  pnede  ser  de  lo 
más  variado.  Se  podría  obtener  más  información  sobre  el  carácter  del  punto  fijo  analizando  el 
crecimiento  y  decrecimiento  de  la  función  f{x).  En  concreto,  si  p  es  un  punto  fijo  indiferente 
de  f(x)  y  la  función  \f'(x)\  presenta  un  máximo  local  (mínimo  local)  en  x  —  p,  entonces  p  es 
un  punto  fijo  atractor  (repulsor). 

Las  funciones  con  una  dinámica  más  sencilla  son  las  lineales.  Los  siguientes  ejemplos  nos 
muestran  su  comportamiento  dinámico. 

Ejemplo  1.8.  Estudio  del  comportamiento  dinámico  de  las  funciones  f(x)  =  ax,  en  función 
del  parámetro  a  £  M. 

Para  cada  x  G  M  denotamos  an{x)  =  fn{x)  =  anx.  Podemos  distinguir  los  si¬ 
guientes  casos: 


1.2.  Conceptos  básicos 


9 


■  Si  |a|  <  1,  an(x)  — >  O,  para  todo  igB.  En  este  caso,  sólo  hay  un  punto  fijo, 
p  —  0,  que  es  atractor. 

■  Si  |a|  >  1,  |an(x)|  — >  oo  para  todo  x  G  M  —  {0}.  En  este  caso,  sólo  hay  un 
punto  fijo,  p  —  0,  que  es  repulsor. 

■  Si  a  =  1,  an(x)  =  x  para  todo  x  €  M.  En  este  caso,  todos  los  puntos  son  fijos 
y  cada  uno  de  ellos  es  indiferente.. 

■  Si  a  =  —1,  an(x)  =  (— l)nx  para  todo  x  €  M.  En  este  caso,  cada  punto 
distinto  de  cero  está  dentro  de  un  2-ciclo  de  la  forma  {x,  —  x}. 


Ejemplo  1.9.  Estudio  del  comportamiento  dinámico  de  las  funciones  de  la  forma  f(x)  = 
ax  +  b,  con  a,  b  e  M,  b  ^  0. 


■  Si  a  =  1,  no  hay  ningún  punto  fijo,  las  órbitas  de  un  punto  x  son  de  la  forma 
x  +  nb.  Por  lo  tanto,  si  b  >  0  estas  órbitas  divergen  a  oo  y  si  b  <  0  estas 
órbitas  divergen  a  —  oo. 

■  Si  a  1,  existe  un  único  punto  fijo:  p  =  6/(1  —  a).  El  carácter  de  este  punto 
fijo  depende  de  a: 

•  Si  \a\  <  1  es  un  punto  fijo  atractor. 

•  Si  |a|  >  1  es  un  punto  fijo  repulsor. 

•  Si  a  =  —1,  p  =  b/2  es  el  único  punto  fijo.  El  resto  de  los  puntos  describen 
2-ciclos  de  la  forma  {x,  b  —  x}. 

El  estudio  de  la  dinámica  de  una  función  de  la  forma  f(x)  =  ax  +  b,  con  |a|  <  1  tiene  una 
interesante  aplicación  en  el  cálculo  de  las  sumas  de  series  geométricas  [143].  En  efecto,  como 
se  puede  ver  en  la  primera  gráfica  de  la  figura  1.2,  las  sumas  parciales  de  la  serie 


b  +  br  +  br2  +  •  •  •  +  brn  +  ■  ■  ■ 


son  precisamente  los  distintos  términos  de  la  órbita  del  cero  por  las  función  f{x)  =  rx  +  b, 
con  0  <  r  <  1.  Por  lo  tanto,  se  puede  probar  así  que  las  sumas  de  la  serie  geométrica  anterior 
es  el  punto  fijo  de  f(x),  es  decir,  6/(1  —  r). 

De  forma  parecida,  tal  y  como  se  muestra  en  la  segunda  gráfica  de  la  figura  1.2,  la  suma 
de  la  serie  geométrica  alternada 

b  —  br  +  br 2  +  •  •  •  +  b(—r)n  +  •  •  • 

es  el  punto  fijo  de  la  función  f(x)  =  —rx  +  b,  con  0  <  r  <  1,  es  decir,  b¡ (1  +  r). 
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(— - — ) 

'  1+r  5  1+r ' 

y  =  b  —  rx 


Figura  1.2:  Sumas  de  una  serie  geométrica  y  de  una  serie  geométrica  alternada  como  itera¬ 
ciones  de  punto  fijo. 


1.3.  Conjugación  Topológica 

Uno  de  los  conceptos  básicos  en  el  estudio  de  la  dinámica  de  una  función  es  el  de  conjuga¬ 
ción  topológica ,  el  cual  damos  a  continuación.  En  líneas  generales,  la  conjugación  topológica 
permite  reducir  el  estudio  dinámico  de  algunas  familias  de  funciones  a  algunas  situaciones 
concretas. 

Definición  1.10.  Sean  f:D—*Dyg:E—*E  dos  funciones.  Decimos  que  ellas  son 
topológicamente  conjugadas  si  existe  un  homeomorfismo1  p  :  D  — >  E  tal  que  p  o  f  =  g  o  p, 
es  decir 

+/(-))  =  9(<p(z)),  zeD. 

En  este  caso,  p  se  llama  conjugación  topológica  entre  f  y  g. 

La  definición  anterior  se  traduce  en  el  diagrama  conmutativo  que  se  muestra  en  la  figu¬ 
ra  1.3.  Sin  pretender  extendernos  mucho  en  este  apartado,  se  puede  resaltar  el  hecho  de  que 
la  conjugación  topológica  entre  dos  funciones  envía  los  puntos  fijos  de  una  a  los  de  la  otra, 
los  puntos  periódicos  a  los  puntos  periódicos,  los  puntos  con  un  comportamiento  asintótico 
a  puntos  con  el  mismo  comportamiento  y,  en  general,  la  órbita  de  un  punto  Xo  G  D  en  la 
órbita  de  su  transformado  p(xf)  G  E. 

El  siguiente  teorema  resume  los  hechos  básicos  de  la  relación  entre  la  dinámica  de  dos 
funciones  topológicamente  conjugadas.  Mostramos  aquí  unas  líneas  generales  de  su  demos¬ 
tración. 

Teorema  1.7.  Sean  f:D^Dyg:E^E  dos  funciones,  y  sea  p  :  D  — ►  E  una 
conjugación  topológica  entre  f  y  g.  Entonces 

(a)  p~l  :  E  — >  D  es  también  una  conjugación  topológica  entre  g  y  f . 


1  Aplicación  continua  con  inversa  continua. 
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D 


f 


D 


<p 


E 


9 


E 


Figura  1.3:  Diagrama  resultante  de  una  conjugación  topológica. 


(b)  (p  o  fn  =  gn  o  (p  para  todo  n  G  N. 

(c)  p  es  un  punto  periódico  de  f  si  y  sólo  si  (p(p)  es  un  punto  periódico  de  g.  Además,  p  y 
<p(p)  tienen  períodos  iguales. 

(cj  Para  funciones  derivables,  si  p  es  un  punto  periódico  de  f  y  <p'  no  se  anula  en  la  órbita 
dep,  entonces  p  y  <p{p)  tienen  el  mismo  carácter  (atractor,  repulsor,  indiferente). 

(d)  Si  p  es  un  punto  periódico  de  f  con  cuenca  de  atracción  B(p),  entonces  la  cuenca  de 
atracción  de  (p(p)  es  ip(B(p)). 

(e)  Los  puntos  periódicos  de  f  son  densos  en  D  si  y  sólo  si  los  puntos  periódicos  de  g  son 
densos  en  E. 

(f)  f  es  caótica  sobre  D  si  y  sólo  si  g  es  caótica  sobre  E. 

Demostración.  El  apartado  (a)  se  sigue  directamente  de  la  definición  y  del  hecho  de  que  p 
tiene  inversa  continua.  Por  consiguiente,  se  tiene  que  /(<^_1(u))  =  93_1(g(w)),  u  G  E.  Por 
otra  parte,  para  z  £  D  se  tiene  que 

<^(/2(-))  =  P(f(f(z)))  =  9(p(f(z)))  =  g(g(<p(z)))  =  g2(tp(z)). 


Siguiendo  un  razonamiento  inductivo,  se  deduce  que 

cp(fn(z))  =  <p{ f{r~\z )))  =  g{ip{fn-\z)))  =  g(gn-\<p(z)))  =  gn(^z)), 

con  lo  que  se  deduce  el  apartado  (b).  Supongamos  ahora  que  p  es  un  punto  periódico  de  /, 
de  período  k.  Entonces  k  es  el  menor  valor  para  el  que  fk(p )  =  p.  Teniendo  en  cuenta  el 
apartado  anterior,  se  tiene 

<p(p)  =  p(fk(p))  =  gk(p{p))-  (i-i) 


En  consecuencia  <p{p)  es  un  punto  periódico  de  g  con  el  mismo  período  k,  como  se  pone  de 
manifiesto  en  (c). 
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Para  probar  el  apartado  (cj  tendremos  en  cuenta  que,  por  el  teorema  1.6  el  carácter 
de  un  punto  fijo  p  de  f  viene  dado  por  el  valor  de  \f'(p)\-  Análogamente,  el  carácter  de  un 
punto  periódico  p,  de  período  k  viene  dado  por  el  valor  de  \  fr(po)f'(Pi)  •  •  •  f'(Pk- 1)|,  donde 
Pj  =  P(p)  para  j  =  0, 1, . . . ,  k  —  1.  Teniendo  esta  notación  en  cuenta  y  derivando  en  la 
segunda  igualdad  de  (1.1)  tenemos  que 

(p'(fk(p))f'(Po)f'(pi)  ■  ■  ■  f\pk- 1)  =  g'(qo)g'(qi)  ■  ■■g\qk-i)p\p), 

donde  q3  =  g^{jp{p))  para  j  =  0, 1, . . . ,  k  —  1.  Como  <p\fk{p))  =  <p'(p)  0,  tenemos  que  el 

carácter  de  p  como  punto  periódico  de  /  y  de  p(p)  como  punto  periódico  de  g  es  el  mismo. 

El  apartado  (d)  se  basa  de  nuevo  en  la  idea  de  que  la  conjugación  respeta  las  órbitas.  Así, 
si  la  órbita  de  un  punto  z0  G  D  converge  a  un  punto  periódico  p  de  /,  entonces,  la  órbita 
de  ip(z o)  converge  al  punto  periódico  <p(p)  de  g.  Recíprocamente,  si  la  órbita  de  un  punto 
u0  G  E  converge  a  un  punto  periódico  q  de  g,  entonces,  la  órbita  de  9?_1(«o)  converge  al 
punto  periódico  9?_1(g)  de  /.  Por  consiguiente,  zq  G  B(p)  si  y  sólo  si  (p(zo)  G  (p(B(p)). 

Los  apartados  (e)  y  (f)  hacen  referencia  a  conceptos  que  introducimos  en  la  sección  1.5. 
Para  profundizar  en  estas  ideas  recomendamos  al  lector  consultar  dicha  sección  así  como, 
entre  otras,  las  referencias  [43]  y  [91].  □ 

Mostramos  a  continuación  unos  cuantos  ejemplos  para  ilustrar  los  resultados  teóricos 
dados  en  el  teorema  anterior. 

Ejemplo  1.10.  Las  aplicaciones  /,  g  :  M  — >  M  definidas  por  f(x)  =2 x  y  g(x)  =  8x  son 
conjugadas  por  el  homeomorfismo  tp  :  M  — >  M  dado  por  (p(x)  =  x3. 

Es  una  comprobación  inmediata: 

p  o  /  o  (p^1(x)  =  tp(2x 1^3)  =  23{x1^3)3  =  8x  =  g(x). 


Ejemplo  1.11.  Las  aplicaciones  f(x)  =  2 x  y  g(x)  =  x/2  no  pueden  ser  conjugadas. 
En  primer  lugar,  notemos  que  para  todo  x  >  0, 

lím  fn(x )  =  lím  2nx  =  oo. 

n— >oo  n— >oo 

Por  otra  parte,  para  todo  igR, 

X 

lím  qn(x)  =  lím  —  =  0. 

n— xx)  v  7  n — >oo  2n 

Si  /  y  g  fuesen  topológicamente  conjugadas,  existiría  un  homeomorfismo  tp  tal 
que  fn  =  ip ~1  o  gn  o  tp.  Entonces,  para  todo  x  >  0, 

lím  fn(x )  =  lím  (p~x  o  gn  o  tp(x)  =  93_1(0)  G  M, 


lo  que  es  una  contradicción.  Por  lo  tanto,  /  y  g  no  pueden  ser  conjugadas. 
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Ejemplo  1.12.  ¿Qué  relación  debe  existir  entre  los  parámetros  a,b  E  M  para  que  las  aplica¬ 
ciones  cuadráticas  ga{x)  =  ax(l—x)  y  hb(x)  =  1—bx2  sean  conjugadas  por  un  homeomorfismo 
de  la  forma  <p{x)  =  ax  +  (3,  con  a  ^  0? 


Notemos  en  primer  lugar  que  ip  transforma  el  punto  crítico  de  hb  en  el  punto 
crítico  de  ga,  es  decir,  99(0)  =  1/2.  En  consecuencia,  (3  —  1/2  y,  por  tanto,  (p(x)  = 
ax  +  1/2.  Para  determinar  a  usamos  la  ecuación  de  conjugación 

ga  o  (p(x)  =  tpo  hb(x). 


Tenemos  entonces 

ga  °  <p{x) 


Por  otra  parte 


ga  (ax  +  ^ 

a(ax+\)  (i-(°:c+D) 


< p  o  hb{x)  =  tp(  1  —  bx 2) 

=  a(  1  -  bx2)  +  ^ 

=  a  +  -  —  abx2. 


Igualando  las  partes  constantes  y  los  coeficientes  que  acompañan  a  x2,  obtenemos 
las  ecuaciones 

f  a/4  =  a  +  1/2 
[  aa2  =  ab. 

De  la  segunda  ecuación,  obtenemos  que  a  =  b/a.  Reemplazando  este  valor  en  la 
primera  de  esas  ecuaciones  se  obtiene  que  los  parámetros  a  y  b  en  esas  dos  familias 
de  aplicaciones  para  los  cuales  tenemos  la  conjugación  están  relacionados  por 


En  este  caso,  a  debe  ser  elegido  como 

b  a  —  2 


Por  ejemplo,  en  el  caso  particular  de  que  a  =  4  y  b  =  2,  se  tiene  que  a  =  1/2. 
Por  tanto,  las  aplicaciones  ¿q (x)  =  Ax(l  —  x)  y  Ii2(x)  =  1  —  2x2  son  conjugadas 
por  el  homeomorfismo  (p(x)  =  {x  +  l)/2. 
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El  teorema  1.7  asegura  que  dos  aplicaciones  conjugadas  topológicamente  generan  dinámi¬ 
cas  equivalentes.  Esta  idea  permite  reducir  el  estudio  de  las  dinámicas  de  algunas  familias  de 
funciones  a  algunos  casos  concretos.  Uno  de  los  ejemplos  más  significativos  de  esta  situación 
resulta  ser  el  estudio  dinámico  de  los  polinomios  de  segundo  grado.  Aunque,  en  principio 
un  polinomio  cuadrático  puede  depender  de  tres  parámetros,  tras  un  proceso  de  conjugación 
topológica  se  puede  reducir  el  estudio  a  una  familia  de  polinomios  dependientes  de  un  solo 
parámetro. 

Ejemplo  1.13.  Sea  f(x)  =  ax 2  +  bx  +  c,  con  a  0,  un  polinomio  de  segundo  grado  con 
coeficientes  reales.  Entonces,  las  dinámicas  de  esta  familia  de  funciones  son  conjugadas  to¬ 
pológicamente  con  las  dinámicas  de 

fn{x)  =  x2  +  /i,  jueM.  (1.2) 

Es  decir,  de  los  tres  parámetros  que  aparecen  en  f ,  dos  de  ellos  son  innecesarios  para  describir 
la  dinámica,  y  en  realidad  sólo  basta  un  parámetro,  ¡i,  para  llevar  a  cabo  esta  tarea. 

Afirmamos  qne  de  esos  tres  parámetros  a,  b  y  c  dos  de  ellos  son  «ilusorios»  (innece¬ 
sarios)  desde  el  punto  de  vista  dinámico.  Para  verlo,  consideremos  una  aplicación 
afín  L(x)  =  ax  +  ¡3,  con  a^O.  Tenemos  que  L  es  biyectiva  y  L_1(a;)  =  (x  —  (3)/a. 

La  función  g(x)  =  (L”1  o  f  o  L)  (x)  es  también  cuadrática  y,  por  el  teorema  1.7, 
la  descripción  de  las  órbitas  de  g  equivale  a  la  descripción  de  las  órbitas  de  /. 
Recordemos  que  L  es  llamada  una  conjugación  entre  /  y  g,  y  como  en  este  caso  L 
es  afín,  la  llamaremos  conjugación  afín.  La  expresión  explícita  de  g  es  la  siguiente 

g(x)  =  L~l  o  f  o  L(x) 


a  (L(x))2  +  bL(x )  +  c  —  (3 
a 


=  aax2  +  (2  a/3  +  b)x  + 


a/3'2  +  b/3  +  c  —  (3 
a 


Ahora,  elegimos  a  y  (3  de  modo  qne  aa  =  1  y  2 a/3  +  b  =  0,  es  decir,  a  =  1/a  y 
/ 3  =  —b/{2a).  De  aquí  resulta  que  g(x)  =  x2  +  p,  con 

4ac  +  2b  —  b2 


Finalmente,  denotamos  g  por  f¡x ,  pues  depende  sólo  del  parámetro  /i. 


Notemos  qne  los  polinomios  definidos  en  (1.2)  tienen  puntos  fijos  en  los  valores 

1  ±  VI  -4 ji 
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que  son  reales  para  p  <  1/4  y  complejos  para  p  >  1/4.  Si  nos  centramos  en  los  números 
reales,  esto  hace  que  el  comportamiento  dinámico  de  los  polinomios  de  la  familia  definida  en 
(1.2)  sea  sencillo  para  p  >  1/4  pero  mucho  más  complicado  para  p  <  1/4.  Vamos  a  precisar 
estos  aspectos  en  los  dos  siguientes  ejemplos. 

Ejemplo  1.14.  Si  p  >  1/4,  los  iterados  de  cualquier  punto  por  tienden  a  +oo.  Si  p  =  1/4, 
se  tiene  que  p  =  1/2  es  un  punto  fijo  indiferente  con  cuenca  de  atracción  [—1/2, 1/2], 


El  primer  caso  es  de  comprobación  inmediata,  pues  j),  no  tiene  puntos  fijos  y  su 
gráfica  está  por  encima  de  la  diagonal  y  =  x.  En  el  segundo  caso,  si  p  =  1/4, 
aparece  un  único  punto  fijo  en  x  =  1/2.  Además,  /1/4( — 1/2)  =  1/2,  y  los  puntos 
en  el  intervalo  [—1/2, 1/2]  se  aproximan  al/2  por  iteraciones  de  /1/4.  Por  otra 
parte,  los  puntos  de  (— 00,  — l/2)U(l/2,  00)  tienden  a  +00  bajo  iteraciones  de  /1/4. 

Ejemplo  1.15.  Para  p  <  1/4,  las  dinámicas  de  la  familia  cuadrática  f/Jx)  =  x2  +  p  son 
conjugadas  topológicamente  con  las  dinámicas  de  la  función  logística 

£\(x)  =  Ax(l  —  x). 


Consideremos  una  transformación  afín  T(x)  =  7 x  +  ó,  con  7  /  0  y  calculemos 
T-'ofpoTix): 


T-1  o  o  T(x) 


U(T(x))-6 

7 


(' T(x ))2  +  p  -  5 
7 


=  7a;2  +  2  8x  + 


52  +  p- ó 

7 


Ahora  hacemos  ó2  —  5  +  p  =  0,  es  decir, 

,  1± 

s  =  — 2 — ■ 

Notemos  que  es  aquí  donde  se  requiere  la  condición  p  <  1/4.  Usamos  sólo  el  valor 
positivo  de  la  raíz,  es  decir,  5  —  (1  +  y/1  —  áp)/2  y  reemplazando  obtenemos: 

T^1  o  f^  o  T(x)  =  'yx2  +  (1  +  y/lzr4p)x. 

Tomando  ahora  7  =  —  (1  +  y/1  —  4 p),  resulta  que 

T^1  o  fu  o  T(x)=  7x(l  -  x) 


que  es  la  función  logística  con  A  =  7. 
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1.4.  Estudio  dinámico  de  la  función  logística 

En  la  sección  anterior  hemos  visto  que  las  dinámicas  de  la  función  logística 

i\(x)  —  Ax(l  —  x).  (1.3) 

pueden  servir  para  estudiar  el  comportamiento  dinámico  de  las  funciones  definidas  en  (1.2) 
y,  por  lo  tanto,  de  cualquier  polinomio  de  segundo  grado.  En  concreto,  la  relación  entre  los 
parámetros  /j  y  A  que  aparecen  en  las  funciones  definidas  en  (1.2)  y  (1.3)  es 

A  =  1  +  a/1  —  4/i. 

Notemos  que  la  situación  que  nos  queda  pendiente  de  estudio  para  la  familia  (1.2)  es  ¡i  <  1/4, 
que  conduce  a  estudiar  la  función  logística  (1.3)  para  A  >  1.  No  obstante,  vamos  a  proceder 
a  realizar  un  estudio  más  general  de  las  dinámicas  de  (1.3)  para  A  >  0. 

La  función  logística  (1.3)  es  un  clásico  entre  los  estudios  de  las  dinámicas  de  funciones  de 
variable  real.  A  pesar  de  su  aparente  sencillez,  en  ella  se  engloban  la  mayoría  de  situaciones 
que  se  nos  pueden  plantear  en  el  estudio  de  una  función  cualquiera,  incluyendo  fenómenos 
tales  como  las  bifurcaciones  o  comportamientos  caóticos.  Se  pueden  encontrar  un  gran  número 
de  referencias  sobre  la  función  logística.  Como  una  pequeña  muestra,  se  pueden  consultar  [15], 
[43],  [56],  [93],  [97]  o  [114]. 

Antes  de  comenzar  con  el  estudio  dinámico  de  la  función  logística,  observemos  que  po¬ 
demos  reducir  el  intervalo  de  estudio  al  intervalo  /  =  [0,1].  En  efecto,  si  x0  ^  /,  entonces 
x\  =  Í\{xq)  <  0  y  el  resto  de  iteraciones  por  í\  van  decreciendo  hacia  —  oo. 

Notemos  también  que  para  cada  A  se  tiene  que  f/(0)  =  0  y  f/(l)  =  0.  Además,  la  parábola 
definida  por  í\  tiene  un  máximo  absoluto  cuando  x  =  1/2. 

Por  último,  observemos  que  í\  tiene  dos  puntos  fijos:  0  y  X\  =  (A  —  1)/A.  De  la  ubicación 
del  segundo  punto  fijo  y  del  carácter  atractor  o  repulsor  de  ambos  va  a  depender  en  gran 
manera  el  comportamiento  dinámico  de  la  función  logística  (1.3).  Nótese  que 

<i(0)  =  A  y  //A/j=2-A.  (1.4) 

De  (1.4)  se  obtienen  las  caracterizaciones  de  los  puntos  fijos  de  (1.3)  que  se  muestran  en  el 
cuadro  1.1. 

Después  de  estas  consideraciones  generales,  vamos  a  pasar  al  estudio  de  la  función  logística 
(1.3)  para  distintos  valores  de  A  y  para  x  e  /  =  [0, 1]. 

La  función  logística  para  0  <  A  <  1 

Dejando  a  un  lado  el  caso  A  =  0  para  el  cual  la  función  logística  tiene  un  comportamiento 
trivial  (de  hecho,  la  órbita  de  cualquier  punto  x  G  /  es  (x,  0,  0  ...}),  se  tiene  que  l\  sólo  tiene 
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Cuadro  1.1:  Comportamiento  de  los  puntos  fijos  de  la  función  logística,  0  y  x\  =  (A  —  1)/A, 
para  diferentes  valores  de  A.  Notemos  que  para  A  =  1  ambos  puntos  fijos  coinciden. 


0  <  A  <  1 

A  =  1 

1  <  A  <  3 

A  =  3 

A  >  3 

0 

Atractor 

Indiferente 

Repulsor 

Repulsor 

Repulsor 

X\ 

Fuera  de  / 

Indiferente 

Atractor 

Indiferente 

Repulsor 

Figura  1.4:  Función  logística  para  A  =  0.9:  órbita  de  xq  =  0.6  y  comportamiento  conjunto 
de  las  órbitas  de  todos  los  puntos  del  intervalo  [0, 1]. 

en  el  intervalo  /  a  0  como  punto  fijo.  Además  este  punto  fijo  es  atractor  ya  7^(0)  =  A  <  1 
(véase  (1.4)).  Además  la  órbita  de  cualquier  punto  xq  G  (0, 1)  decrece  a  0  cuando  n  — >  oo. 

En  la  figura  1.4  se  muestra,  para  A  =  0.9,  la  órbita  del  punto  Xq  =  0.6  y  el  comportamiento 
conjunto  de  las  órbitas  de  todos  los  puntos  del  intervalo  [0, 1]  que  se  obtiene  representando 
las  gráficas  de  las  composiciones  iteradas  de  la  función  í\  consigo  misma.  Como  se  aprecia 
en  la  figura  estas  iteraciones  se  aproximan  a  la  función  constante  igual  a  cero. 

La  función  logística  para  A  =  1 

Para  A  =  1,  los  dos  posibles  puntos  fijos  de  la  función  logística,  0  y  x\  =  (A  —  1) / A, 
confluyen  en  uno  sólo:  x  —  0.  En  este  caso,  se  trata  de  un  atractor  «débil»  en  [0, 1],  ya  que, 
í\  (0)  =  1.  En  este  caso,  la  órbita  de  cualquier  punto  xq  G  (0, 1)  también  decrece  a  0  cuando 
n  — »  oo.  El  comportamiento  gráfico  es  muy  similar  al  que  se  muestra  en  la  figura  1.4. 
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La  función  logística  para  1  <  A  <  2 

A  partir  de  ahora,  para  A  >  1,  se  tiene  que  x  =  0  es  punto  fijo  repulsor.  Pero,  por  otra 
parte,  el  otro  punto  fijo  x\  —  (A  —  1)/A  está  en  el  interior  del  intervalo  I.  Además,  en  el  caso 
1  <  A  <  3,  se  trata  de  un  punto  fijo  atractor. 

En  efecto,  para  1  <  A  <  2,  se  sigue  de  (1.4)  que  0  <  í'x(x\)  <  1.  Además,  en  este  caso,  se 
puede  probar  que  la  función  logística  tiene  únicamente  dos  puntos  eventualmente  fijos:  x  —  1 
y  x  =  1/A  (nótese  que  para  A  =  2  este  segundo  punto  coincide  con  el  punto  fijo  atractor  x\, 
que  ahora  resulta  ser  un  superatractor) .  Los  puntos  eventualmente  fijos  tienen  su  influencia 
en  el  comportamiento  dinámico  de  la  función  logística.  En  concreto  se  tiene: 

■  Las  órbitas  de  x0  G  (0,^)  crecen  monótonamente  hacia  x\. 

■  Las  órbitas  de  x0  G  (xx,  1/A)  decrecen  monótonamente  hacia  xx. 

■  Si  Xq  G  (1/ A,  1)  se  tiene  que  x\  =  £x(x0)  G  (0,xa).  A  partir  de  aquí,  las  órbitas  crecen 
monótonamente  hacia  x\. 

Estos  comportamientos  se  muestran,  para  algunos  casos  concretos,  en  la  figura  1.5. 

En  este  caso,  las  funciones  iteradas  í\  tienden  a  las  aplicaciones  constantes  dadas  por 
y  =  x a,  como  se  muestra  en  la  figura  1.6. 


Figura  1.5:  Órbitas  de  xq  =  0.1  para  A  =  2,  de  xq  =  0.5  para  A  =  1.1  y  de  de  xq  =  0.9  para 
A  =  1.5.  Nótese  la  distinta  forma  de  converger  a  los  respectivos  puntos  fijos  1/2,  1/11  y  1/3. 


La  función  logística  para  2  <  A  <  3 

El  carácter  de  los  puntos  fijos  es  el  mismo  que  en  el  caso  anterior:  x  =  0  es  repulsor  y 
x\  =  (A  —  1) / A  es  atractor,  ya  que  de  (1.4)  se  deduce  —1  <  £'x(x a)  <  0.  La  principal  novedad 
es  que  ahora  aparecen  una  cantidad  numerable  de  puntos  eventualmente  fijos.  Estos  puntos 
tienen  su  influencia  en  el  comportamiento  dinámico  de  la  función  logística.  En  concreto, 
en  este  caso,  las  órbitas  se  aproximan  por  ambos  lados  a  xx  y  aparece  una  «espiral»  en  el 
seguimiento  de  la  órbita,  como  puede  verse  en  la  figura  1.7. 


1.4.  Estudio  dinámico  de  la  función  logística 
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Figura  1.6:  Comportamiento  conjunto  de  las  órbitas  de  todos  los  puntos  del  intervalo  [0, 1] 
para  A  =  1.5  y  para  A  =  2. 


Figura  1.7:  Función  logística  para  A  =  2.8:  órbita  de  xq  =  0.2  y  comportamiento  conjunto 
de  las  órbitas  de  todos  los  puntos  del  intervalo  [0, 1]. 


La  función  logística  para  A  =  3 

El  comportamiento  en  este  caso  es  muy  similar  al  caso  anterior,  con  la  única  diferencia 
de  que  el  punto  fijo  x\  =  2/3  es  un  punto  indiferente  en  lugar  de  atractor.  No  obstante  su 
cuenca  de  atracción  sigue  siendo  todo  el  intervalo  (0, 1).  El  comportamiento  gráfico  es  similar 
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al  mostrado  en  la  figura  1.7,  aunque  con  una  convergencia  mucho  más  lenta. 

La  función  logística  para  3<A<l  +  v/6~  3.4495 

Para  A  >  3,  ambos  puntos  fijos  0  y  x\  son  repulsores.  ¿Qué  ocurre  con  las  órbitas  de  los 
puntos  de  /,  distintos  de  0  y  X\1 

Considerando  la  aplicación  í\  =  b  °  Aj  vemos  que  su  gráfico  intersecta  la  diagonal  en 
otros  dos  puntos  aparte  de  los  puntos  fijos  de  í\.  Esto  significa  que  existen  puntos  x\,x2 
tales  que  í\{x\)  =  x2  y  í\(x2)  =  aq,  en  otras  palabras,  aparece  una  órbita  periódica  de 
período  2,  también  denominada  un  2-ciclo.  Podemos  observar  esta  situación  en  las  gráficas 
de  la  figura  1.8. 


Figura  1.8:  En  negro,  las  gráficas  de  para  A  =  3  y  para  A  =  3.2:  el  punto  fijo  x\  se  ha 
bifurcado  en  dos  puntos  fijos  de  i\. 

Lo  que  ha  ocurrido  es  que  el  punto  fijo  X\  de  í\  que  se  comportaba  como  un  atractor 
para  1  <  A  <  3,  se  ha  descompuesto  en  el  ciclo  atractor  {aq,x2}-  Para  encontrar  este  ciclo, 
analizamos  las  soluciones  de  la  ecuación 


x  =  i\  (d\(x))  =  A  (Ax(l  —  x))  (1  —  Ax(l  —  a;)) . 

Ésta  es  una  ecuación  de  cuarto  grado  cuyas  raíces  son  los  puntos  fijos,  r  =  0y  x\ ,  además 
de  los  puntos  sobre  la  órbita  periódica.  Encontramos  X\  y  x2,  dividiendo  el  polinomio  por 
x  (x  —  x\).  Así,  después  de  unas  pocas  manipulaciones  algebraicas,  se  llega  a  la  expresión 

Ia  (Ia(jO)  -x 

X  (x  —  X\) 


A(A2x2  —  X2x  —  Xx  +  A  +  1). 
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Las  soluciones  de  esta  ecuación  cuadrática  son: 


La  estabilidad  del  ciclo  depende  del  valor  (¿x)'{xj),  j  =  1,2,  el  cual  es  el  mismo  para  aq 
y  X‘¿.  Notemos  que 

(/a)  O  j)  =  4  (h(xj))  ■  4  (xj)  =  4(®i)  •  4(^2). 


En  consecuencia,  |(4)/(xj)l  <  1  si  |4  +  2A  —  A2|  <  1.  Resolviendo  esta  desigualdad  para 
0  <  A  <  4,  encontramos  que  es  cierta  para  3  <  A  <  1  +  a/6  ~  3.449489743.  Entonces,  para 
A  en  este  intervalo,  la  órbita  de  cualquier  punto  del  intervalo,  excepto  los  puntos  fijos  y  los 
eventualmente  fijos,  tiende  al  2-ciclo  atractor  {xi,^}. 


Figura  1.9:  Función  logística  para  A  =  3.3:  órbita  de  xq  =  0.1  y  comportamiento  conjunto 
de  las  órbitas  de  todos  los  puntos  del  intervalo  [0, 1].  En  ambos  casos,  se  puede  observar  la 
presencia  de  un  2-ciclo  atractor. 


La  función  logística  para  1  +  y/6  <  A  <  Aqo  ~  3.5699 

Ahora,  para  A  >  1  +  a/6  ~  3.4495  la  órbita  periódica  {x\,x2}  es  repulsora  y  en  su 
lugar  aparece  una  órbita  atractora  de  período  4.  Esta  órbita  puede  encontrarse  resolviendo 
numéricamente  i\(x)  =  x  y  £\(x)  /  x.  En  concreto,  se  puede  mostrar  que  esa  órbita  periódica 
de  período  4  es  atractora  para  3.4495  . . .  <  A  <  3.5441 ...  y  repulsora  para  A  >  3.5441 . . . 

Para  A  >  3.5441 . . .  una  órbita  periódica  atractora  de  período  8  emerge.  Numéricamente 
esta  se  obtiene  resolviendo  f\(x)  —  x  y  í\(x)  /  x.  Esta  órbita  de  período  8  es  atractora  para 
3.5441 . . .  <  A  <  3.54644  ...  y  repulsora  para  A  >  3.54644 . . . 


22 


Sistemas  dinámicos  discretos 


Figura  1.10:  Función  logística  para  A  =  3.5:  órbita  de  a?o  =  0.3  y  comportamiento  conjunto 
de  las  órbitas  de  todos  los  puntos  del  intervalo  [0, 1].  En  ambos  casos,  puede  observarse  la 
presencia  de  un  4-ciclo  atractor. 

Observemos  ahora  los  valores  para  los  cuales  apareció  una  nueva  órbita  periódica,  de 
período  el  doble  de  la  que  había  aparecido  antes:  A0  =  1,  Ai  =  3,  A2  =  1  +  a/6  ~  3.4495 . . . , 
A3  ~  3.5441 . . . ,  A4  ~  3.5644 . . .  Llamamos  a  este  fenómeno  bifurcación  de  duplicación  de 
período.  Puede  probarse  que  este  fenómeno  se  va  repitiendo,  pasando  por  todos  los  períodos 
de  la  forma  2n,  hasta  llegar  a  un  valor  límite 

Aoo  =  lím  Xn  ~  3.5699. 

n— >00 

Al  valor  A^  se  le  llama  constante  de  Feigenbaum  o  punto  de  entrada  al  caos.  En  este  caso 
existe  una  familia  numerable  de  órbitas  periódicas  repulsoras  correspondientes  a  todos  los 
períodos  de  la  forma  2n.  Pero  además,  existe  un  conjunto  invariante  de  tipo  Cantor  y  con 
carácter  atractor  contenido  en  el  complementario  de  los  ciclos  repulsores. 

El  diagrama  de  bifurcación  para  la  función  logística,  conocido  como  diagrama  de  Feigen¬ 
baum  se  muestra  en  la  figura  1.11.  Básicamente  se  construye  representando  los  puntos  a  los 
que  converge  la  órbita  del  punto  Xq  =  1/2  para  diferentes  valores  del  parámetro  A.  En  el 
diagrama  se  aprecian  las  diferentes  duplicaciones  del  período  que  se  van  produciendo  y  cómo 
se  vuelve  extremadamente  intrincado  a  partir  del  punto  Aoo.  En  la  figura  1.12  se  muestran  dos 
partes  ampliadas  del  diagrama  de  Feigenbaum  en  las  que  se  aprecia  las  distintas  bifurcaciones 
que  se  van  produciendo. 
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Figura  1.11:  Diagrama  de  Feigenbaum  asociado  a  la  función  logística  í\{x)  definida  en  (1.3). 
En  el  eje  de  abcisas  se  muestran  los  valores  del  parámetro  A  y  en  el  eje  de  ordenadas  los 
puntos  a  los  que  converge  la  órbita  del  punto  xq  =  1/2. 


0.9 


0.88 


0.88 


0.84 


0.82 


0.8 


3.45  3.475  3.5  3.525  3.55  3.575  3.6 


Figura  1.12:  Dos  ampliaciones  del  diagrama  de  Feigenbaum. 

La  función  logística  para  Aoo  <  A  <  4 

El  punto  Aqc  marca  la  separación  entre  el  régimen  de  períodos  y  el  régimen  caótico  para  es¬ 
ta  familia  cuadrática:  las  órbitas  de  dos  puntos  muy  cercanos  pueden  ser  totalmente  distintas. 
Esto  se  observa  por  ejemplo  analizando  las  series  temporales  de  xq  =  0.75  y  xq  =  0.75000001 
para  A  =  4. 

Aunque  para  A  >  Aoo,  la  mayoría  de  los  casos  presentan  un  comportamiento  caótico, 
todavía  existen  algunos  valores  de  A  con  un  comportamiento  periódico,  dando  lugar  a  unas 
franjas  de  regularidad  dentro  del  diagrama  de  Feigenbaum  conocidas  como  islas  de  estabilidad. 

■  Para  A  ~  3.627  aparece  un  6-ciclo  atractor. 
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Figura  1.13:  Dos  nuevas  ampliaciones  del  diagrama  de  Feigenbaum:  en  la  primera  de  ellas 
se  aprecia  la  aparición  de  un  3-ciclo  atractor  que  se  va  bifurcando,  dando  lugar  a  una  isla 
de  regularidad.  El  segundo  detalle  muestra  el  intrincado  comportamiento  para  valores  del 
parámetro  A  cercanos  a  4. 

■  Para  A  ~  3.702  aparece  un  7-ciclo  atractor. 

■  Para  A  ~  3.74  aparece  un  5-ciclo  atractor. 

■  Para  A  =  1  +  \/8  ~  3.828  aparece  un  3-ciclo  atractor,  que  a  su  vez  se  irá  bifurcando 
en  ciclos  de  períodos  6, 12,  24, . . .  hasta  llegar  a  un  valor  límite  aproximadamente  3.855 
(véase  la  figura  1.13). 

La  función  logística  para  A  =  4 

En  este  caso,  existen  puntos  periódicos  repulsores  de  todos  los  períodos  posibles.  Además, 
éstos  son  densos  en  el  intervalo  /  =  [0, 1],  es  decir,  dado  un  intervalo  abierto  cualquiera  en 
I,  siempre  existe  un  punto  periódico  en  su  interior.  Como  se  puede  ver  en  la  figura  1.14,  el 
comportamiento  de  las  órbitas  de  un  punto  xq  G  I  es  caótico  y  la  evolución  de  las  gráficas  de 
las  composiciones  de  la  función  £4  consigo  misma  tiende  a  «rellenar»  el  cuadrado  [0, 1]  x  [0,1]- 

La  función  logística  para  A  >  4 

Al  igual  que  en  el  caso  A  =  4,  existen  puntos  periódicos  repulsores  de  todos  los  períodos 
posibles.  Como  novedad,  a  partir  de  A  =  4,  aparecen  puntos  cuyas  órbitas  escapan  del 
intervalo  /  =  [0, 1]  y  tienen  un  comportamiento  divergente  a  — oo.  La  órbita  de  uno  de  estos 
puntos  se  muestra  en  la  figura  1.15,  junto  con  la  evolución  de  las  gráficas  de  las  composiciones 
de  la  función  í\  consigo  misma.  Como  se  aprecia,  las  gráficas  de  dichas  composiciones  escapan 
ya  del  intervalo  /  =  [0, 1]. 
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Figura  1.14:  Función  logística  para  A  =  4:  órbita  de  xq  =  0.3  y  comportamiento  conjunto  de 
las  órbitas  de  todos  los  puntos  del  intervalo  [0, 1]. 


Figura  1.15:  Función  logística  para  A  =  4.2:  órbita  de  xq  =  0.9  y  comportamiento  conjunto 
de  las  órbitas  de  todos  los  puntos  del  intervalo  [0, 1]. 

Series  temporales  de  la  función  logística 

Para  finalizar  esta  sección,  y  a  modo  de  resumen,  analizamos  las  series  temporales  de  la 
función  logística  para  distintos  valores  del  parámetro  A.  En  las  figuras  1.16-1.19  se  muestran 
las  gráficas  de  las  órbitas  de  un  mismo  punto,  x0  =  0.75,  para  algunos  valores  representativos 
del  parámetro  A.  En  estas  figuras  el  número  de  iteraciones  n  aparece  en  el  eje  horizontal, 
mientras  que  en  el  eje  vertical  se  representan  los  correspondientes  valores  de  xn  =  ín[x o). 

En  las  cuatro  primera  figuras,  correspondientes  a  los  valores  de  los  parámetros  A  =  0.8, 
A  =  2,  A  =  2.8  y  A  =  3,  se  aprecia  la  convergencia  hacia  un  punto  fijo.  Las  tres  figuras 
siguientes  muestran  la  aparición  de  ciclos  periódicos.  En  concreto  un  2-ciclo  para  A  =  3.3, 
un  4-ciclo  para  A  =  3.5  y  un  8-ciclo  para  A  =  3.6.  Las  dos  últimas  series  temporales  de  la 
figura  1.18  muestran  ya  una  dinámica  mucho  más  complicada. 
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Finalmente,  en  la  figura  1.19,  se  aprecia  ya  el  comportamiento  caótico  y  una  gran  sensibi¬ 
lidad  a  las  condiciones  iniciales.  De  hecho,  pequeños  cambios  en  los  datos  iniciales  provocan 
unos  resultados  totalmente  diferentes. 


Figura  1.16:  Series  temporales  de  la  función  logística  para  xq  =  0.75,  con  A  =  0.8,  A  =  2  y  A  =  2.8. 


Figura  1.17:  Series  temporales  de  la  función  logística  para  xq  =  0.75,  con  A  =  3,  A  =  3.3  y  A  =  3.5. 


1.5.  Sistemas  dinámicos  caóticos 

Con  el  estudio  dinámico  de  la  función  logística  ha  aparecido  de  forma  experimental  el 
concepto  de  caos.  Llegados  a  este  punto,  se  hace  necesario  definir  dicho  concepto  con  más 
precisión.  Para  ello,  enunciamos  a  continuación  la  definición  de  caos  introducida  por  Devaney 
en  1992  [42],  Previamente,  necesitamos  definir  tres  nuevos  conceptos. 

Definición  1.11.  Un  sistema  dinámico  discreto  (X,  f)  se  dice  topológicamente  transitivo  si 
dados  dos  subconjuntos  abiertos  cualesquiera  U  y  V  de  X ,  existe  n  G  N  tal  que  fn(U)C\V  ^  0. 
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Figura  1.18:  Series  temporales  de  la  función  logística  para  xq  =  0.75,  con  A  =  3.6,  A  =  3.74 
y  A  =  3.828. 


Figura  1.19:  Series  temporales  de  la  función  logística  para  xo  =  0.75,  con  A  =  4,  xq  = 
0.750000001,  con  A  =  4  y  xq  =  0.75,  con  A  =  4.2. 

Definición  1.12.  Sea  Y  un  subconjunto  de  X.  Se  dice  que  Y  es  denso  en  X  si  para  cualquier 
subconjunto  abierto  U  de  X,  siempre  existe  un  punto  de  Y  en  U . 

Definición  1.13.  Un  sistema  dinámico  discreto  (X,  f )  es  sensible  respecto  a  las  condiciones 
iniciales  si  existe  un  S  >  0  tal  que,  para  todo  x  G  X  y  para  todo  e  >  0,  existen  y  G  X  y  n  G  N 
tales  que 

d(x,  y)  <£  y  d(fn(x),fn(y ))  >  5, 

donde  d  denota  la  distancia  correspondiente  en  el  espacio  métrico  X.  A  este  fenómeno  se  le 
conoce  también  con  el  nombre  de  efecto  mariposa. 

Definición  1.14.  Un  sistema  dinámico  discreto  (X,f)  se  dice  caótico  si  cumple  las  tres 
condiciones  siguientes: 
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1.  Es  topológicamente  transitivo. 

2.  El  conjunto  de  puntos  periódicos  de  f  es  denso  en  X . 


3.  El  sistema  es  sensible  respecto  a  las  condiciones  iniciales. 

Con  posterioridad  a  la  definición  de  Devaney,  en  1992,  Banks  et  al.  [10]  demuestran 
que  la  sensibilidad  a  las  condiciones  iniciales  es  una  exigencia  redundante,  ya  que  se  puede 
deducir  de  las  otras  dos  propiedades.  No  obstante,  eliminar  la  sensibilidad  de  las  condiciones 
iniciales  de  la  definición,  nos  proporciona  una  idea  menos  intuitiva  del  concepto  de  caos.  Aún 
podemos  encontrar  una  caracterización  más  del  concepto  de  sistema  dinámico  caótico,  dada 
por  Touhey  [145]  en  1997  que  establece  que  un  sistema  dinámico  es  caótico  si  y  sólo  si  para 
cualesquiera  U  y  V  conjuntos  abiertos  de  X,  existe  una  órbita  periódica  que  visita  ambos. 
Esta  propiedad  implica  las  tres  condiciones  de  la  definición  de  Devaney. 

Teorema  1.8  (Touhey,  [145]).  Sea  (X i,/)  un  sistema  dinámico  discreto  tal  que  para  dos 
conjuntos  abiertos  no  vacíos  cualesquiera  U,  V  C  X ,  existe  un  punto  periódico  p  G  U  tal  que 
fn(p )  G  V  para  algún  n  G  N,  entonces  el  sistema  dinámico  es  caótico  en  el  sentido  de  la 
definición  de  Devaney. 


Veamos  ahora  unos  ejemplos  básicos  de  sistemas  dinámicos  caóticos. 


Ejemplo  1.16.  El  sistema  dinámico  (X,S),  donde  X  =  [0,1]  y  S  es  la  función  conocida 
como  «diente  de  sierra»  ( saw-tooth  function )  y  definida  por 


{2x  si  0  <  x  <  - 

1  2  (1.6) 

2x  —  1  si  -  <  x  <  1 

es  caótico. 


Obsérvese  que  tanto  x  =  0  como  x  —  1  son  puntos  fijos  de  S(x).  La  forma  más 
clara  de  entender  cómo  actúa  la  función  (1.5)  para  el  resto  de  puntos,  se  obtiene 
escribiendo  la  representación  binaria  de  un  número  x  G  (0, 1): 

X  =  (0. 0.10203  •  •  •  )2  =  oq2  1  +  022  2  +  032  3  +  •  •  •  , 

donde  a¿  G  {0, 1}  para  i  >  1.  Es  conocido  que  en  el  sistema  decimal  un  mismo  nú¬ 
mero  puede  tener  dos  representaciones.  Por  ejemplo,  se  tiene  que  1  =  0.9999  •  •  •  = 
0.9  o  0.5  =  0.49999  •  ■  •  =  0.49,  donde  ~  representa  la  expresión  que  se  repite  pe¬ 
riódicamente.  Lo  mismo  ocurre  en  el  sistema  binario,  donde  podemos  escribir 
1/2  =  (0.1)2  o  1/2  =  (0.01)2.  Para  evitar  ambigüedades,  en  números  con  dos 
representaciones  elegiremos  siempre  la  finita.  Así,  usaremos  1/2  =  (0.1)2  y  no 
(1/2  =  0.01)2. 
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Figura  1.20:  Gráfica  de  la  función  «diente  de  sierra»  con  las  órbitas  de  los  puntos  xq  =  0.1  y 
xq  =  \/2/2.  Un  simple  análisis  gráfico  parece  sugerir  un  comportamiento  periódico  en  ambos 
casos.  Sin  embargo,  un  análisis  más  detallado  muestra  que  esto  no  es  así. 

Notemos  que  si  x  =  (0.aid2a3  . . .  )2,  entonces  S(x)  =  (0.a2a3  . . .  )2.  La  transfor¬ 
mación  ha  consistido  en  desplazar  el  punto  binario  una  unidad  hacia  la  derecha  y 
eliminar  el  dígito  que  queda  en  la  parte  entera  (a  la  izquierda  del  punto  binario). 
Por  este  motivo,  a  esta  transformación  se  le  llama  también  operador  desplaza¬ 
miento  ( shift  operator). 

Como  todo  número  racional  tiene  una  expresión  en  binario  que  es  finita  o  periódi¬ 
ca,  los  números  racionales  son  puntos  periódicos  de  S(x).  Por  ejemplo,  además  de 
los  dos  únicos  puntos  fijos,  0  y  1,  tenemos  un  2-ciclo  formado  por:  1/3  =  (0.01)2 
y  2/3  =  (0.10)2.  Hay  dos  3-ciclos,  uno  que  comienza  por  el  punto  1/7  =  (0.001)2 
y  otro  que  comienza  por  el  punto  3/7  =  (0.011)2.  En  concreto,  estos  dos  3-ciclos 
son  {1/7,  2/7, 4/7}  y  {3/7,  6/7,  5/7},  respectivamente. 

En  general,  se  puede  probar  (véase  [56]  o  [115]  para  un  análisis  más  detallado  de 
estas  cuestiones)  que  los  puntos  n-periódicos  son  números  racionales  de  la  forma 
p/{ 2n  —  1),  aunque  esta  representación  no  tiene  porqué  estar  escrita  de  forma 
irreducible.  Por  ejemplo,  es  sencillo  comprobar  que  existen  tres  4-ciclos: 

J1  2  4  8}  í  3  6  12  9  1  f  7  14  13  11} 

115’ 15’ 15’ 15/’  1 15’ 15’ 15’ 15 /  ’  l 15’ 15’ 15’ 15 J  ' 

Todos  son  de  la  forma  p/(24  —  1).  Sin  embargo,  los  posibles  numeradores  p  de 
estas  fracciones  no  recorren  el  conjunto  {1, . . . ,  14}.  Esto  es  debido  a  que  algunas 
fracciones  de  la  forma  p/ 15  ya  habían  aparecido  en  ciclos  más  cortos.  En  concreto 
5/15  =  1/3  y  10/15  =  2/3  eran  los  componentes  del  2-ciclo  existente. 
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Llegados  a  este  punto,  queremos  hacer  notar  que  si  x  £  (0, 1)  es  un  punto  con 
representación  binaria  infinita  y  no  periódica,  entonces  la  órbita  Sn(x)  no  puede 
ser  periódica.  El  punto  x  =  \f2¡2  considerado  en  la  segunda  gráfica  de  la  figu¬ 
ra  1.20  es  de  estas  características,  por  tanto,  su  órbita  no  puede  ser  periódica,  tal 
y  como  sugería  la  representación  gráfica. 

El  hecho  conocido  de  que  los  números  racionales  (que  son  los  puntos  periódicos  de 
S(x))  son  densos  en  los  reales  ya  nos  permite  aventurar  que  el  sistema  dinámico 
([0, 1],  S )  es  caótico.  Para  demostrarlo  con  más  rigor,  veamos  que  dados  dos  con¬ 
juntos  abiertos  U  y  V  cualesquiera  de  [0, 1],  existe  una  órbita  periódica  que  visita 
ambos.  En  efecto,  sean  x  =  (0. «10203  . . .  )2  £  U  e  y  =  (0.6i6263  ■  •  •  )2  £  V.  Como 
U  y  V  son  abiertos,  existe  n  £  N,  lo  suficientemente  grande,  tal  que  el  punto 

z  =  (0.0iO:2  •  •  •  anb  ib2  •  •  •  bnaia2  . . .  anbxb2  ...bn...)2eU 

ya  que  \z  —  x\  <  2~n.  Pero  por  otra  parte,  la  órbita  de  z  también  tiene  puntos  de 
V  ya  que 

Sn(z)  =  (O.6162  •  •  •  6noia2  •  •  •  anbib2  . . .  6noia2  . . .  an  . . .  )2  £  V 

y  entonces  |S'"(^)  —  y\  <  2~n. 

Por  último,  notemos  que  z  es  periódico  ya  que 

S2n{z)  =  (O.oia2  •  •  •  anbib2  . . .  bn)2  =  z. 

En  consecuencia,  aplicando  el  teorema  1.8,  el  sistema  dinámico  asociado  a  la 
función  «diente  de  sierra»  definida  en  (1.5)  es  caótico. 

Ejemplo  1.17.  El  sistema  dinámico  (X,T),  donde  X  =  [0,1]  y  T  es  la  función  conocida 
como  «tienda  de  campaña»,  definida  por 

!  2x 

T(x)  = 

2(1  -  x 

es  caótico. 

El  comportamiento  de  la  función  «tienda  de  campaña»  es,  en  cierto  modo,  similar 
al  de  la  función  «diente  de  sierra»  (1.5)  ya  que  las  órbitas  de  los  puntos  racionales 
son  periódicas.  De  hecho,  para  estudiar  el  comportamiento  de  la  función  (1.6)  nos 
podemos  apoyar  en  el  ejemplo  anterior.  No  es  complicado  probar  por  inducción 
que 


«5  6  \  \ 


si  -  <  X  <  1 
2  -  ~ 


(1.6) 


Tk+1(x)  =  T(Sk(x)),  ¡ce  [0,1],  fc>l. 
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Figura  1.21:  Gráfica  de  la  función  «tienda  de  campaña»  con  las  órbitas  de  los  puntos  xq  =  0.1 
y  xq  =  \/2/2.  Al  igual  que  en  la  figura  1.20,  sólo  las  órbitas  de  puntos  racionales  tienen  un 
comportamiento  periódico.  Los  puntos  irracionales,  como  xo  =  \/2/2,  tienen  órbitas  no 
periódicas. 

Para  demostrarlo,  aplicamos  de  nuevo  el  teorema  1.8.  Sean  x  =  (0.aia2a3 . . .  )2  G 
U  e  y  =  (0.bib2b3 . . .  )2  e  V  dos  puntos  de  dos  conjuntos  abiertos  cualesquiera  U 
y  V  de  [0, 1].  Entonces,  existe  n  G  N,  lo  suficientemente  grande,  tal  que  el  punto 

z  =  (0.aia2  •  •  •  an06i&2  . . .  fe„0aia2  . . .  a„0&i&2  . . .  bn0  . . .  )2  e  U 

ya  que  \z  —  x\  <  2~n.  Pero  por  otra  parte,  la  órbita  de  z  también  tiene  puntos  de 
V  ya  que 

Tn+\z)  =  T(Sn(z ))  =  T(0.0M2  •  •  •  Maia2  . . .  an 0)2 
=  (0.6i62  . . .  6n0aia2 . . .  dn0)2  E  V 
puesto  que  | Tn+1{z)  —  y\  <  2~n. 

Además,  z  es  periódico  ya  que 


T2n+2{z )  =  T(S2n+1(z ))  =  T(0.0a1a2  . . .  an0M2  •  •  •  &n0) 


=  0.aia2  . . .  an0bib2  . . .  bn 0  =  z. 

En  definitiva,  hemos  probado  que  el  sistema  dinámico  asociado  a  la  función  «tien¬ 
da  de  campaña»  definida  en  (1.6)  es  caótico. 

Ejemplo  1.18.  El  sistema  dinámico  (X,  £4),  donde  X  =  [0, 1]  y  £4  es  la  función  logística  de 
parámetro  X  =  4,  £±{;x)  =  4x(l  —  x),  es  caótico. 
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Para  demostrarlo,  nos  apoyamos  de  nuevo  el  teorema  1.8  y  en  el  hecho  de  que 
la  función  «tienda  de  campaña»  T(x),  definida  en  el  ejemplo  anterior,  es  caó¬ 
tica.  Además,  notemos  que  T  y  £4  son  top ológicamente  conjugadas  mediante  el 
homeomorfismo  h(x)  =  sen2(7nr/2).  En  efecto,  se  tiene  que 

h  o  T(x)  =  £4  o  h(x),  x  E  [0, 1]. 

Es  más,  h  o  Tk(x)  =  £\  o  h(x)  para  todo  k  >  1.  Por  lo  tanto,  si  xQ  es  un  punto 
n-periódico  de  T,  entonces  h(x 0)  es  un  punto  n-periódico  de  í 4 .  Teniendo  esto  en 
cuenta,  sean  ahora  U  y  V  dos  abiertos  cualesquiera  de  X.  Denotamos  U'  =  /i_1(t/) 
y  V1  =  h_1(D)  a  los  correspondientes  abiertos  obtenidos  a  partir  de  la  inversa 
del  homeomorfismo  h.  Como  la  función  T  es  caótica,  existe  Xq  E  U'  tal  que 
Tn(x 0)  =  xq  y  además  Tk(x 0)  E  V' .  Pero  entonces  h(x 0)  E  U  cumple  Q(xo)  =  xo 
y  £k(xo)  E  V.  Aplicando  el  teorema  1.8  se  deduce  que  £4  es  una  aplicación  caótica 
en  il  intervalo  =  [0, 1]. 

Ejemplo  1.19.  La  función  de  iteración  del  método  de  Newton 

N'(x)  =  x~% 

para  resolver  una  ecuación  no  lineal  f(x)  =0  puede  presentar  un  comportamiento  caótico, 
para  una  particular  elección  de  f(x). 


Por  ejemplo,  no  hay  más  que  aplicar  dicho  método  a  la  función 

/iQr-lj  +  ló17^ 
x  ) 

donde  p  >  1  y  x  ^  0. 

Unos  sencillos  cálculos  nos  muestran  que 

NfSx)  =»x{l~x), 


que  no  es  otra  que  la  función  logística  estudiada  en  la  sección  1.4  y  que  es  la 
representante  obligada  cuando  se  habla  de  aplicaciones  caóticas. 


Capítulo  2 

El  método  de  Newton 


2.1.  Introducción 

La  resolución  de  ecuaciones  no  lineales  es  uno  de  los  problemas  matemáticos  que  más 
frecuentemente  aparece  en  diversas  disciplinas  científicas.  Así,  con  la  notación 

f(x)  =  0  (2.1) 

englobamos  el  problema  de  encontrar  una  incógnita  x,  que  puede  ser  un  número  real  o 
complejo,  un  vector,  una  función,  entre  otros,  a  partir  de  los  datos  que  nos  proporciona  la 
función  /,  que  puede  ser,  por  ejemplo,  una  función  escalar,  un  sistema  de  ecuaciones,  una 
ecuación  diferencial,  una  ecuación  integral,  etc. 

Incluso  en  el  caso  de  que  /  sea  una  función  real  de  variable  real  es  bien  conocido  que, 
en  general,  no  es  posible  resolver  de  forma  exacta  una  ecuación  no  lineal.  Es  por  ello  que  se 
recurre  a  técnicas  iterativas  para  obtener  aproximaciones  de  la  solución. 

Sin  duda,  dentro  de  estas  técnicas  iterativas,  el  método  de  Newton  es  el  procedimiento 
más  estudiado  y  empleado  en  la  práctica.  Así,  con  el  objetivo  de  aproximar  una  solución  a 
de  una  ecuación  no  lineal  (2.1),  el  método  de  Newton  consiste  en  construir,  a  partir  de  una 
aproximación  inicial  xo  de  a,  una  sucesión  de  la  forma 

_  f{xn)  ^  n  ío  o\ 

xn+ 1  xn  j,.  /  V )  TI  0.  (2.2) 

/  (Xn) 

En  condiciones  adecuadas,  la  sucesión  anterior  converge  a  la  solución  buscada  a. 

Es  costumbre  extendida  entre  los  investigadores  el  bautizar  sus  descubrimientos  con  su 
propio  nombre  o  con  el  de  un  personaje  relevante  en  la  materia.  En  este  caso,  el  nombre 
de  este  método  está  ligado  al  eminente  científico  británico  Isaac  Newton.  Sus  trabajos  de 
finales  del  siglo  XVII  parecen  ser  el  germen  del  proceso  que  actualmente  lleva  su  nombre. 
Sin  embargo,  tal  y  como  se  recogen  en  numerosos  trabajos  de  índole  histórico  dedicados  a 
la  evolución  del  método  de  Newton,  éste  es  fruto  de  las  aportaciones  de  un  gran  número  de 
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científicos,  tanto  anteriores  como  posteriores  a  Newton.  En  la  sección  2.2  se  presenta  de  forma 
detallada  la  evolución  histórica  del  método  (2.2),  tal  y  como  se  recoge  en  [46].  Además,  las 
referencias  qne  allí  se  citan  pueden  servir  al  lector  para  profundizar  en  este  extenso  tema. 


2.2.  Historia  del  método  de  Newton 

Se  ha  escrito  mucho  sobre  el  origen  y  evolución  de  lo  que  hoy  conocemos  como  método  de 
Newton  para  resolver  ecuaciones  no  lineales.  De  hecho,  incluso  no  hay  consenso  en  el  nombre 
del  método  y  muchos  autores  lo  denominan  método  de  Newton-Raphson  [31]  e,  incluso, 
método  de  Newton- Raphson-Simpson  ([7],  [153]).  Es  más,  tal  y  como  podemos  encontrar 
en  [84],  dos  de  las  características  fundamentales  del  método  de  Newton  empleado  en  la 
actualidad  son  que  es  iterativo  y  que  incluye  el  uso  de  la  derivada,  aunque  ninguna  de  esas 
dos  peculiaridades  fueran  observadas  por  Newton.  Las  siguientes  notas  se  han  extraído  del 
trabajo  [46],  publicado  en  la  Gaceta  de  la  RSME,  donde,  entre  otras  cosas,  se  presenta  el 
desarrollo  histórico  del  método  de  Newton. 


Figura  2.1:  Tablilla  YBC  7289  de  la  Yale  Babylonian  Collection  (fotografía  de  Bill  Casselman 
[27]). 


Aunque  la  «paternidad»  del  método  se  atribuye  a  Isaac  Newton,  la  idea  de  encontrar 
una  cantidad  desconocida  mediante  aproximaciones  sucesivas  se  remonta  a  muchos  siglos 
atrás.  Así,  en  la  Grecia  clásica  ya  se  utilizaban  técnicas  para  aproximar  números  irracionales 
(sobre  todo  7r)  por  números  racionales.  Pero  incluso  antes,  dos  mil  años  antes  de  Cristo,  las 
civilizaciones  mesopotámicas  ya  conocían  técnicas  para  aproximar  la  raíz  cuadrada  de  un 
número.  Las  referencias  al  respecto  son  abundantes.  A  modo  de  ejemplo,  citamos  los  textos 
de  Bailey  [7],  Knill  [83]  o  Neugebauer  y  Sachs  [105].  En  particular,  en  [105,  p.  42-43]  se 
pone  de  manifiesto  cómo  en  la  tablilla  YBC  7289  (véase  la  figura  2.1)  de  la  Yale  Babylonian 
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Collection  [150]  aparece  un  cuadrado  de  30  unidades  de  lado  en  cuya  diagonal  están  escritos 
los  números  1;  24,  51, 10  y  42;  25,  35. 1 

La  conversión  al  sistema  decimal  de  la  primera  cantidad  es  1.4142129629  . . . ,  que  coincide 
hasta  la  quinta  cifra  decimal  con  y/2  =  1.4142135623 . . .  Además,  la  segunda  cantidad  es  el 
producto  de  30  por  la  primera  y  es,  por  tanto,  la  longitud  de  la  diagonal  del  cuadrado.  Así 
pues,  parece  claro  que  los  babilonios  conocían  un  valor  aproximado  para  y/2  y  que  lo  usaban 
para  sus  cálculos. 

Otro  indicio  de  que  los  babilonios  sabían  cómo  aproximar  cantidades  irracionales  aparece 
en  la  tablilla  VAT6598  que  se  conserva  en  el  museo  de  Berlín  y  está  fechada  en  2000-1700  a. 
C.  En  ella  se  plantea,  entre  otros,  el  problema  de  encontrar  la  diagonal  de  un  rectángulo  de 
altura  40  y  lado  10.  Con  la  notación  actual,  el  problema  se  traduciría  en  encontrar 

V402  +  102  =  vTfoo. 

En  la  misma  tablilla  se  propone  como  aproximación  el  valor  41;  15  =  41  +  15/60.  No  se 
sabe  cómo  se  obtuvo  este  valor,  ni  tampoco  hay  indicios  de  que  se  use  un  proceso  iterativo, 
pero  algunos  autores  [31]  destacan  el  hecho  de  que  esta  cantidad  coincida  con  la  conocida 
aproximación  para  una  raíz  cuadrada 

VhF+P  -h  +  !^r 

2li 

para  h  =  40  y  l  =  10. 

La  aproximación  anterior  se  conoce  como  fórmula  de  Herón  para  el  cálculo  de  raíces 
cuadradas,  en  la  que,  partiendo  de  una  aproximación  inicial  a  de  y/A,  se  propone  como  nueva 
aproximación  (a  +  A/a)/ 2.  En  efecto,  para  A  =  h2  +  l2  y  a  =  h,  la  aproximación  dada  en 
la  tablilla  babilónica  coincide  con  la  aproximación  de  Herón.  Aunque  hay  quien  atribuye  la 
fórmula  de  Herón  al  pitagórico  Arquitas  de  Tarento  (428-365  a.  C.)  o  incluso  a  Arquímedes 
(282-212  a.  C.),  [7],  donde  el  método  aparece  es  en  el  primer  tomo  de  la  Métrica  que  Herón 
publicó  en  el  siglo  I.  En  este  texto,  descubierto  por  H.  Schóne  en  1896  (véase  [31]  para  más 
detalles)  se  muestra  cómo  Herón  calculaba  el  área  de  un  triángulo  de  lados  7,  8  y  9  unidades, 
es  decir,  V720.  En  el  mismo,  Herón  se  refiere  explícitamente  a  que  una  aproximación  dada 
puede  ser  tomada  como  punto  de  partida  para  obtener  mejores  aproximaciones.  Parece  claro, 
por  tanto,  que  estamos  ante  la  primera  referencia  de  la  utilización  de  un  proceso  iterativo 
para  resolver  un  problema. 

Ahora  bien,  ¿fue  el  método  de  Herón  novedoso  en  su  época?  o  ¿era  una  técnica  ya  cono¬ 
cida  y  que  había  sido  empleada  por  civilizaciones  anteriores?  La  respuesta  queda  en  el  aire, 

Hos  babilonios  usaban  un  sistema  de  numeración  cuneiforme  de  base  sexadecimal.  En  la  actualidad,  los 
expertos  en  el  tema  escriben  los  números  babilónicos  usando  una  mezcla  de  nuestra  notación  en  base  10  y  su 
notación  en  base  60.  El  equivalente  babilónico  de  la  coma  decimal  se  denota  con  un  punto  y  coma.  El  resto 
de  los  dígitos  se  separan  por  comas.  Así,  el  número  5,  51, 13;  2,  30  significa  5  x  602  +  51  x  60  +  13  +  2  x  1/60  + 
30  x  1/602  ~  21073.0416. 
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Figura  2.2:  Herón  de  Alejandría  (10-70  d.  C.  aproximadamente)  y  su  fórmula  para  calcular 
el  área  A  de  un  triángulo,  conocidos  sus  lados  a,  b  y  c:  A  =  y/s(s  —  a)(s  —  b)(s  —  c),  con 
s  =  (a  +  b  +  c)/2. 

aunque  la  mayoría  de  los  investigadores  en  esta  parte  de  la  Historia  de  las  Matemáticas  pa¬ 
recen  inclinarse  hacia  la  segunda  opción,  ya  que  hay  constancia  del  uso  de  textos  babilónicos 
por  parte  de  matemáticos  y  astrónomos  contemporáneos  con  Herón.  Por  ejemplo,  Claudio 
Ptolomeo  (100-170  d.  C.)  cita  en  su  Almagesto  datos  astronómicos  de  la  época  del  rey  asirio 
Nabonassar  (747  a.  C.). 

A  partir  de  la  fórmula  de  Herón,  las  técnicas  para  calcular  la  raíz  cuadrada  de  un  número 
(y,  en  general,  las  raíces  n-ésimas)  se  fueron  transmitiendo  y/o  redescubriendo  a  través  de  los 
siglos  y  de  las  civilizaciones  hasta  el  siglo  XVII.  Aunque  no  hay  muchas  evidencias  escritas 
de  lo  que  ocurrió  durante  este  largo  período  de  tiempo,  sí  que,  a  modo  de  ejemplo,  se  pueden 
encontrar  algunas  referencias  sobre  métodos  para  el  cálculo  de  raíces  n-ésimas  [31]. 


Figura  2.3:  Sello  con  la  figura  de  Liu  Hui  (220-280  d.  C.  aproximadamente),  autor  de  una 
versión  comentada  del  Jiuzhang  suanshu,,  una  de  cuyas  páginas  se  muestra  a  su  derecha. 


Podemos  citar,  por  ejemplo,  el  libro  chino  de  Matemáticas  por  excelencia,  el  Jiuzhang 
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suanshu,  que  se  traduce  por  Nueve  capítulos  del  arte  matemático.  Se  conoce  una  versión 
del  siglo  III,  con  comentarios  de  Liu  Hui  (220-280  d.  C.  aproximadamente),  que  contiene 
una  colección  de  problemas  que  requieren  el  cálculo  de  raíces  cuadradas  y  cúbicas  [107]. 
Posteriormente,  en  el  siglo  IV,  Teón  de  Alejandría  (335-405  d.  C.  aprox.),  padre  de  Hypatia, 
desarrolló  un  método  totalmente  geométrico  para  el  cálculo  aproximado  de  raíces  cuadradas. 
En  los  trabajos  del  matemático  persa  Sharaf  al-Din  al-Tusi  (1135-1213)  se  encuentran  las 
soluciones,  tanto  algebraicas  como  numéricas,  de  algunas  ecuaciones  cúbicas.  Además,  parece 
ser  que  al-Tusi  fue  el  primero  en  calcular  la  derivada  de  un  polinomio  de  tercer  grado. 

En  el  trabajo  Raf  al-Hijab  del  matemático  árabe  Al-Marrakushi  ibn  Al-Banna  (1256- 
1321),  que  podríamos  traducir  por  Que  levanta  el  velo,  se  indica  cómo  calcular  raíces  cuadra¬ 
das  usando  series  y  fracciones  continuas.  Parece  ser  que  Al-Banna  fue  un  gran  recopilador  de 
los  conocimientos  matemáticos  de  su  época,  y  que  en  sus  escritos  nos  muestra  su  versión  de 
los  trabajos  de  matemáticos  árabes  anteriores. 

El  problema  de  encontrar  la  raíz  n-ésima  de  un  número  fue  evolucionando  hacia  el  pro¬ 
blema  más  general  de  encontrar  las  raíces  de  una  ecuación  polinómica  e,  incluso,  de  una 
ecuación  trascendental,  como  por  ejemplo  la  conocida  ecuación  de  Kepler,  que  formalmente 
se  puede  escribir  como 

f(x)  —  x  +  a  sen  x  —  b 

y  de  la  que  hablaremos  con  más  detalle  en  el  ejemplo  2.2. 

En  esta  época  son  numerosos  los  intentos  para  encontrar  de  manera  algebraica  las  solucio¬ 
nes  de  ecuaciones  polinómicas.  Como  anécdota,  se  puede  destacar  la  pugna  que  mantuvieron 
algunos  matemáticos  del  Renacimiento  italiano  para  resolver  las  ecuaciones  de  tercer  y  cuarto 
grado.  Por  entonces  era  habitual  que  los  matemáticos  participaran  en  competiciones  públi¬ 
cas  para  demostrar  su  ingenio,  además  de  para  poder  ganar  dinero  en  las  apuestas  que  se 
suscitaban  (véase  [140]  para  más  detalles).  En  1535  tuvo  lugar  una  de  estas  competiciones  en 
las  que  participaron  los  matemáticos  Antonio  Fiore  y  Niccolo  Fontana,  apodado  Tartaglia , 
el  «tartamudo».  En  este  tipo  de  competiciones,  cada  participante  proponía  problemas  a  su 
oponente,  y  el  que  más  resolviera  era  el  ganador.  Los  problemas  que  se  plantearon  Fiore  y 
Tartaglia  hacían  referencia  a  la  resolución  de  ecuaciones  cúbicas.  Por  entonces,  las  ecuacio¬ 
nes  cúbicas  estaban  clasificadas  en  tres  tipos,  de  los  cuales  Fiore  sólo  sabía  resolver  uno  y 
Tartaglia  había  aprendido  a  resolver  los  tres.  Evidentemente,  Tartaglia  fue  el  vencedor  de  la 
competición,  pues  propuso  a  su  oponente  ecuaciones  de  los  tipos  que  no  sabía  resolver. 

La  noticia  del  duelo  Fiore-Tartaglia  llegó  a  oídos  de  otro  matemático  de  la  época,  Ge- 
rolamo  Cardano,  que  estaba  escribiendo  un  texto  sobre  álgebra.  Cardano  quiso  añadir  a  su 
libro  los  métodos  para  resolver  ecuaciones  cúbicas.  Para  ello  le  pidió  a  Tartaglia  que  se  los 
comunicara.  Pero  Tartaglia  era  algo  reacio  a  ello,  no  en  vano  sus  técnicas  eran  una  forma  de 
ganarse  la  vida.  Finalmente  Tartaglia  accedió  y  transmitió  a  Cardano  sus  conocimientos,  con 
la  condición  de  que  éste  no  los  publicara.  Pero  años  más  tarde,  en  1545,  Cardano  publicó  su 
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Figura  2.4:  Gerolamo  Cardano  (1501-1576)  y  Niccolo  Fontana  (1500-1557),  alias  Tartaglia , 
dos  de  los  protagonistas  de  la  intriga  renacentista  sobre  el  descubrimiento  de  las  soluciones 
de  una  ecuación  cúbica. 


Ars  Magna ,  en  la  cual  aparecían  las  soluciones  de  las  ecuaciones  de  tercer  y  cuarto  grado. 
La  polémica  estaba  servida  y  Tartaglia  acusó  a  Cardano  de  plagio,  sin  que  el  hecho  de  que 
Cardano  hubiese  dado  todo  el  crédito  del  descubrimiento  a  Tartaglia  fuese  un  atenuante.  Aún 
así,  Cardano  supo  defenderse  y  justificó  la  ruptura  de  su  pacto  con  Tartaglia.  En  efecto,  con 
anterioridad  a  la  publicación  de  su  obra  Ars  Magna ,  llegaron  a  manos  de  Cardano  los  escritos 
inéditos  de  otro  matemático,  fechados  con  anterioridad  a  su  encuentro  con  Tartaglia  y  en  los 
que,  de  forma  independiente,  se  resolvían  los  tres  tipos  de  ecuaciones  cúbicas.  Este  mate¬ 
mático  era  Scipione  del  Ferro,  a  la  sazón  maestro  de  Antonio  Fiore.  Por  lo  tanto,  Cardano 
argumentó  que  había  publicado  el  método  del  del  Ferro,  no  el  de  Tartaglia.  Además,  Cardano 
tenía  otra  buena  razón  para  romper  su  pacto  con  Tartaglia:  Ludovico  Ferrari,  discípulo  de 
Cardano,  había  descubierto  un  método  para  resolver  las  ecuaciones  cuánticas.  Este  método 
se  reducía  a  la  resolución  de  una  ecuación  cúbica  asociada.  Por  lo  tanto,  para  publicar  el 
descubrimiento  de  Ferrari,  Cardano  debía  hablar  inevitablemente  del  método  de  Tartaglia. 

Tartaglia  no  entendió  así  las  cosas  y  llegó  a  insultar  públicamente  a  Cardano,  tanto 
personal  como  profesionalmente.  El  conflicto  terminó  con  Ferrari  retando  a  un  debate  público 
a  Tartaglia,  para  defender  a  su  maestro.  Ferrari  venció  con  solvencia  y  Tartaglia  se  tuvo 
que  retirar  de  la  escena  científica.  Como  consecuencia,  las  fórmulas  de  Tartaglia  se  conocen 
actualmente  como  fórmulas  de  Cardano. 

A  partir  del  siglo  XV,  el  problema  se  fue  bifurcando  en  varias  líneas  (resolución  algebraica 
de  ecuaciones  polinómicas,  resolución  aproximada  usando  iteraciones  de  punto  fijo,  aproxima¬ 
ciones  mediante  fracciones  continuas,  etc.).  Para  un  análisis  detallado  del  desarrollo  histórico 
de  estos  problemas  debemos  remitir  al  lector  interesado  a  alguno  de  los  textos  especializados, 
como  [31]  o  [153]. 

Centrándonos  en  el  «nacimiento»  del  método  de  Newton,  podemos  destacar  el  antecedente 
del  matemático  francés  Frangois  Viéte  (1540-1603),  quien  desarrolló  un  ambicioso  proyecto 
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Figura  2.5:  Frangois  Viéte  (1540-1603)  y  William  Oughtred  (1574-1660)  se  encuentran  entre 
los  antecesores  del  método  de  Newton.  Para  muchos  historiadores,  Viéte  fue  quien  inspiró  a 
Newton  para  desarrollar  su  método. 

para  buscar,  de  forma  genérica,  las  soluciones  positivas  de  ecuaciones  polinómicas  de  grados 
2  a  6.  Viéte  fue  el  primero  en  representar  los  parámetros  de  una  ecuación  con  letras,  no  sólo 
las  incógnitas.  El  método  empleado  por  Viéte  («logística  especiosa»  o  «arte  del  cálculo  sobre 
símbolos»)  estaba  inspirado  en  la  tradición  geométrica  griega.  El  método  de  Viéte,  escrito 
en  un  lenguaje  arcaico  y  con  notaciones  engorrosas,  no  tuvo  continuación  y  pronto  pasó  al 
ostracismo,  apartado  por  la  geometría  cartesiana.  Sin  embargo,  Viéte  fue  el  primero  en  darse 
cuenta  de  la  relación  existente  entre  las  raíces  y  los  coeficientes  de  un  polinomio,  e  intentó 
usar  el  álgebra  para  la  resolución  de  estos  problemas. 

El  procedimiento  expuesto  por  Viéte  fue  simplificado  por  otros  matemáticos,  entre  los 
que  podemos  destacar  al  inglés  William  Oughtred  (1574-1660).  En  efecto,  su  obra  Clavis 
Mathematicae,  publicada  en  1631,  fue  considerada  como  un  texto  de  referencia  en  la  época  y 
fue  empleada  por  científicos  como  Wallis  o  Newton.  En  ella  Oughtred  apuesta  por  un  estilo 
más  ligero  a  la  hora  de  escribir  matemáticas,  innovando  en  las  notaciones  que  empleaba,  en 
contraposición  con  el  estilo  más  recargado  empleado  por  Viéte. 

Parece  ser  que  el  trabajo  de  Viéte  fue  el  que  inspiró  a  Isaac  Newton  (1643-1727)  para 
desarrollar  su  método  para  resolver  ecuaciones.  La  primera  referencia  escrita  sobre  el  método 
de  Newton  se  encuentra  en  De  analysi  per  aequationes  numero  terminorum  infinitas ,  en  una 
carta  escrita  a  sus  colegas  Barrow  y  Collins  en  1669,  pero  que  no  fue  publicada  hasta  1711. 
A  los  dos  años  de  escribir  la  citada  carta,  en  1671,  Newton  desarrollaba  su  método  en  De 
metodis  fluxionum  et  serierum  infinitarum.  De  nuevo,  esta  obra  tardó  en  publicarse  y  no  es 
hasta  1736  cuando  se  publica  una  traducción  de  la  misma  bajo  el  título  de  Method  of  Fluxions. 
Como  se  pone  de  manifiesto  en  [25],  la  primera  versión  impresa  del  método  de  aproximación 
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de  Newton,  aparece  en  el  capítulo  94  del  Algebra  de  J.  Wallis,  publicada  en  1685. 


Figura  2.6:  Isaac  Newton  (1643-1727),  el  «padre»  del  conocido  método  para  resolver  ecua¬ 
ciones  no  lineales  que  lleva  su  nombre.  A  la  derecha,  su  estatua  en  la  capilla  del  Trinity 
College  de  Cambridge  realizada  en  1755  por  Louis  Francois  Roubiliac. 

Para  hacernos  una  idea  de  cómo  trabajaba  Newton,  podemos  ilustrar  su  método  con  el 
mismo  ejemplo  que  él  consideró,  la  ecuación  x3  —  2x  —  5  =  0.  Newton  argumentaba  de  la 
siguiente  manera: 

Por  tanteo,  se  ve  que  la  solución  está  cerca  de  2.  Haciendo  x  =  2+ey  sustituyendo 
en  la  ecuación  se  obtiene: 


£3  +  6e2  +  lOe  -  1  =  0.  (2.3) 

Ignorando  los  términos  e3  +  6e2  con  el  pretexto  de  que  £  es  pequeño,  se  llega  a 
que  10e  —  1  ~  0  ó  £  =  0.1.  Entonces,  x  =  2.1  es  una  aproximación  de  la  solución 
mejor  que  la  inicial. 

Haciendo  ahora  £  =  0.1  +  v  y  sustituyendo  en  (2.3)  se  sigue  que 

z/3  +  6.3z/2  +  11.23i/  +  0.061  =  0. 

Ignorando  de  nuevo  los  términos  en  v  de  grado  mayor  o  igual  que  dos,  se  llega 
a  que  v  ~  —0.054  y,  por  tanto,  x  =  2.046  es  una  aproximación  que  mejora  las 
anteriores.  Newton  indicaba  que  el  proceso  se  puede  repetir  las  veces  que  sean 
necesarias. 

Como  vemos,  la  idea  de  Newton  consiste  en  añadir  un  término  corrector  a  una  aproxi¬ 
mación  inicial  dada.  Para  obtener  esta  aproximación,  lo  que  hace  es  truncar  el  binomio  de 
Newton  en  el  segundo  término,  en  expresiones  del  tipo 

(a  +  £)n  ~  an  +  nan~1£. 
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De  esta  manera,  para  obtener  el  valor  aproximado  de  e,  simplemente  hay  qne  resolver  una 
ecuación  lineal. 

Escribiendo  el  problema  con  la  notación  actual  y  llamando  p(x)  =  a;3  —  2x  —  5,  tenemos 
que  la  nueva  aproximación  es 


P(  2) 
p'(  2) 


—  2.1, 


que  se  corresponde  con  la  conocida  formulación  del  método  de  Newton  (2.2)  cuando  f(x) 
es  el  polinomio  p(x )  anterior.  Ahora  bien,  no  se  tiene  constancia  de  que  Newton  usara  el 
cálculo  diferencial  ni  de  que  expresara  el  proceso  como  un  método  iterativo  en  el  sentido  de 
que  una  aproximación  pueda  ser  considerada  como  punto  de  partida  de  la  siguiente.  Además, 
Newton  usaba  «su  método»  sólo  para  resolver  ecuaciones  polinómicas.  El  propio  Newton 
era  consciente  de  que  su  método  pocha  fallar  y  lo  justifica  desde  el  principio  de  su  obra  De 
analysi  per  aequationes  numero  terminorum  infinitas,  donde  encontramos  la  siguiente  cita 
donde  aclara  que  lo  que  ha  escrito  está  brevemente  explicado  más  que  demostrado  con  toda 
diligencia  y  que  lo  que  muestra  es  un  método  general  que  cavilará  un  día  para  medir  la 
cantidad  de  las  curvas  mediante  una  serie  de  términos  infinitos: 


«Methodum  generalem,  quarn  de  curvarum  quantitate  per  Infinitan!  terminorum 
Seriem  mensurada,  olim  excogitaveram,  in  sequentibus  breviter  explicatam  potius 
quam  accurate  demonstratam  habes.» 


Según  algunos  historiadores  como  [25]  o  [128]  ésta  es  una  prueba  de  que  en  esa  época  primaba 
más  el  interés  de  los  matemáticos  por  el  descubrimiento  que  por  la  justificación  rigurosa  de 
lo  descubierto.  Por  todo  ello,  podemos  concluir  que  la  idea  que  Newton  tenía  de  su  método 
dista  bastante  de  la  que  tenemos  hoy  en  día. 

La  idea  de  iteración  se  atribuye  (véanse,  por  ejemplo,  [31]  y  [153])  a  Joseph  Raphson2 
(1648-1715),  quien  además  simplifica  el  aspecto  operacional  de  la  técnica  de  Newton.  En 
1690  publica  un  tratado,  Analysis  Aequationum  Universalis ,  en  el  que  se  dan  fórmulas  explí¬ 
citas  para  el  término  corrector  para  algunos  casos  particulares  de  ecuaciones.  En  concreto, 
calcula  los  términos  correctores  para  las  ecuaciones  a:3  —  r  =  0  y  x3  —  px  —  q  =  0  que  son, 
respectivamente, 


r  —  Xq 


y 


q  +  px  o  -  xl 
3xq  —  P 


siendo  Xq  la  aproximación  inicial. 

Notemos  que  Raphson  publicó  su  obra  46  años  antes  que  el  «Método  de  las  fluxiones»  de 
Newton.  Esta  publicación  no  estuvo  exenta  de  unas  pequeñas  dosis  de  polémica.  En  efecto, 


2Nos  hubiera  gustado  incluir  una  fotografía  de  Raphson,  pero  no  hemos  encontrado  ninguna  disponible 
en  la  red,  como  se  indica  en  la  página  que  Wikipedia  dedica  a  este  científico,  http://en.wikipedia.org/ 
wiki/Joseph_Raphson 
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como  se  menciona  en  [128],  el  propio  Raphson,  en  la  presentación  de  su  método  a  la  Roya! 
Society  en  1690,  es  el  primero  en  reconocer  que  el  método  de  Newton  ya  era  conocido  en 
los  ambientes  científicos  de  la  época  y  que  su  método  era  una  versión  mejorada,  eso  sí.  Así, 
para  no  pecar  de  plagio,  Raphson  cita  en  su  prefacio  a  Newton,  entre  otros  matemáticos.  Sin 
embargo,  en  la  edición  de  1697,  Raphson  solo  se  refiere  a  Viéte  como  el  antecesor  del  método. 
Más  adelante  cita  a  Harriot  y  Oughtred,  pero  solamente  cita  a  Newton  en  el  apéndice  final 
y  en  relación  al  teorema  del  binomio. 

La  contribución  de  Raphson  ha  sido  tenida  en  cuenta  históricamente,  no  en  vano  muchos 
autores  denominan  el  proceso  como  método  de  Newton-Raphson,  sobre  todo  a  partir  del 
trabajo  de  Cajori  [25].  Sin  embargo,  en  los  trabajos  de  Raphson  no  se  aprecia  la  conexión 
existente  entre  el  término  corrector,  la  función  que  define  la  ecuación,  y  su  derivada. 

La  incorporación  del  cálculo  diferencial  se  debe  a  Thomas  Simpson  (1710-1761).  Como  se 
puede  ver  en  [84]  o  [153],  Simpson,  en  su  obra  Essays  on  Mathematics,  publicada  en  1740,  fue 
quien  estableció  el  método  tal  y  como  lo  conocemos  actualmente,  salvo  aspectos  notacionales 
(Simpson  explicaba  de  forma  retórica  cómo  obtener  las  aproximaciones  sucesivas).  Además, 
Simpson  extendió  el  proceso  a  funciones  cualesquiera,  no  solamente  polinomios. 


Figura  2.7:  A  la  izquierda,  Thomas  Simpson  (1710-1761),  el  «gran  olvidado»  en  cuanto  a 
sus  aportaciones  a  lo  que  hoy  conocemos  como  método  de  Newton.  A  la  derecha,  Joseph 
Louis  Lagrange  (1736-1813),  el  primero  en  plantear  interrogantes  sobre  la  convergencia  del 
método  de  Newton. 


Con  motivo  de  ciertas  observaciones  a  propósito  de  la  utilización  de  series  infinitas,  New¬ 
ton  parece  estar  preocupado  por  el  concepto  de  convergencia,  pero  no  aporta  ninguna  solución 
a  este  problema.  La  primera  vez  que  aparece  la  discusión  de  la  convergencia  del  método  de 
Newton  es  en  1768,  en  el  Traite  de  la  résolution  des  équations  en  general  del  francés  Jean 
Raymond  Mourraille  (1720-1808).  A  pesar  de  contener  ideas  novedosas,  la  mayor  parte  del 
trabajo  Mourraille  pasó  inadvertido. 
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Contrariamente  a  Newton  y  Raphson,  Mourraille  hace  hincapié  en  el  aspecto  geométri¬ 
co  del  método  de  Newton,  justificando  que  éste  sea  también  conocido  como  método  de  la 
tangente.  Mourraille  utiliza  la  representación  geométrica  para  explicar  el  comportamiento  de 
la  sucesión  iterativa  producida  por  el  algoritmo  de  Newton.  Además,  Mourraille  observa  por 
primera  vez  que,  dependiendo  del  punto  de  salida  elegido,  la  sucesión  generada  por  el  método 
puede  converger  a  alguna  de  las  raíces  de  la  ecuación,  oscilar,  tender  a  infinito,  o  acercarse  a 
un  límite  que  no  es  solución  de  la  ecuación.  Finalmente,  Mourraille  también  muestra  que  la 
convergencia  puede  ser  más  o  menos  rápida,  pero  solamente  lo  indica  en  forma  cuantitativa. 

Posteriormente  Joseph-Louis  Lagrange  (1736-1813),  publica  su  Traité  de  la  résolution  des 
équations  numériques  de  tous  les  degrés  en  1808  [54],  Esta  obra  es  un  compendio  de  trabajos 
sobre  la  teoría  de  ecuaciones  algebraicas  en  el  que  aparecen,  entre  otros,  métodos  para  separar 
las  raíces  reales  de  una  ecuación  algebraica  o  métodos  de  aproximación  de  raíces  mediante 
fracciones  continuas  (para  más  información  sobre  la  obra  de  Lagrange,  se  pueden  consultar 
las  referencias  [90],  [128]).  En  ella  Lagrange  afirma  que  el  método  atribuido  a  Newton  es  el 
que  se  emplea  habitualmente  para  resolver  ecuaciones  numéricas.  Ahora  bien,  advierte  que 
este  método  sólo  se  puede  usar  para  ecuaciones  que  están  ya  «casi  resueltas»  en  el  sentido  de 
que  para  aplicarlo  se  necesita  una  buena  aproximación  de  la  solución.  Además,  plantea  dudas 
sobre  la  exactitud  de  cada  nueva  iteración  y  observa  que  el  método  puede  tener  problemas 
para  el  caso  de  raíces  múltiples  o  muy  próximas  entre  sí.  También  se  preocupó  por  indicar 
los  procedimientos  para  encontrar  las  soluciones  complejas  de  una  ecuación  algebraica. 

Lagrange  terció  en  la  polémica  sobre  la  asignación  del  método  a  Newton,  Raphson  o 
Simpson.  En  concreto  afirma  que  es  un  hecho  constatable  que  el  método  de  aproximación  de 
Newton  había  aparecido  en  la  versión  inglesa  del  Algebra  de  Wallis,  publicada  en  1685  y  en 
su  posterior  edición  en  latín  de  1693.  Manifiesta  su  sorpresa  por  el  hecho  de  que  Raphson  no 
mencione  a  Newton  en  su  obra  de  1695,  lo  cual  hace  decir  a  Lagrange  que  Raphson  llegó  a 
pensar  que  su  método  era  diferente  al  de  Newton.  Sin  embargo,  el  propio  Lagrange  afirma 
que  ambos  métodos  son  el  mismo,  aunque  presentados  de  forma  diferente. 

Jean  Baptiste  Joseph  Fourier  (1768-1830)  fue  el  primero  en  analizar  la  velocidad  de 
convergencia  del  método  de  Newton  en  una  nota  titulada  Question  d’analyse  algébraique 
(1818)  [54],  En  este  trabajo,  Fourier  expresa  el  método  con  la  notación  actual  (2.2)  y  lo 
bautiza  como  la  méthode  newtonienne,  haciendo  referencia  explícita  a  las  obras  de  Newton, 
Raphson  y  Lagrange.  Quizás,  Fourier  es  el  «causante»  de  la  falta  de  reconocimiento  para  el 
trabajo  de  Simpson. 

El  siguiente  matemático  importante  en  estudiar  el  método  de  Newton  fue  Augustin  Louis 
Cauchy  (1789-1857),  quien  estudió  este  tema  desde  1821,  pero  no  dio  una  formulación  satis¬ 
factoria  hasta  la  publicación  de  las  Legons  sur  le  Calcul  différentiel  en  1829  [54],  Cauchy  da 
condiciones,  en  términos  de  las  derivadas  f  y  f",  para  asegurar  que  el  método  de  Newton  es 
convergente  a  una  solución  a  de  la  ecuación  (2.1)  para  todo  punto  de  partida  xo  perteneciente 
a  un  intervalo  determinado.  Lo  que  Cauchy  estaba  buscando  son,  por  tanto,  resultados  de 
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Figura  2.8:  Jean  Baptiste  Joseph  Fourier  (1768-1830),  quien  «bautiza»  a  (2.2)  como  método 
de  Newton  y  Augustin  Louis  Cauchy  (1789-1857),  los  primeros  en  establecer  condiciones 
para  garantizar  la  convergencia  del  método  de  Newton. 

convergencia  global  para  el  método  de  Newton;  es  decir,  caracterizar  los  intervalos  Ia  C  M 
para  los  que 

lím  xn  =  a ,  con  x$  G  Ia. 

n— »oo 

Aunque  la  mayoría  del  trabajo  de  Cauchy  se  centra  en  el  campo  real,  al  final  del  mismo 
dedica  un  apartado  al  estudio  de  raíces  complejas. 

Los  primeros  avances  en  el  estudio  del  método  de  Newton  para  resolver  ecuaciones  com¬ 
plejas  se  dan  con  los  trabajos  de  E.  Schroder  y  A.  Cayley  en  1870  y  1879  respectivamente. 
De  hecho,  el  que  se  conoce  como  «problema  de  Cayley»  consiste  en  caracterizar  las  regiones 
Sa  del  plano  complejo  para  las  cuales  el  método  de  Newton  converge  a  la  raíz  a  si  xq  G  Sa- 
Este  problema,  inicialmente  resuelto  por  Cayley  para  polinomios  de  segundo  grado,  encerraba 
ciertas  sorpresas  para  polinomios  de  tercer  grado.  En  palabras  del  propio  Cayley,  en  1890: 
«Espero  poder  aplicar  esta  teoría  al  caso  de  una  ecuación  cúbica,  pero  los  cálculos  son  mucho 
más  difíciles».  Cuarenta  años  más  tarde,  los  trabajos  de  Gastón  M.  Julia  (1918)  y  Pierre  J. 
L.  Fatou  (1920)  revelaron  que  el  problema  al  que  se  enfrentaba  Cayley  era  prácticamente 
inabordable  con  los  conocimientos  y  técnicas  de  su  época.  Como  se  indica  en  el  capítulo  4,  el 
estudio  de  las  dinámicas  del  método  de  Newton  para  funciones  de  variable  compleja  no  es  en 
absoluto  trivial  y  requiere  de  conocimientos  y  resultados  que  no  se  desarrollaron  hasta  bien 
entrado  el  siglo  XX. 

El  hecho  de  pensar  en  el  método  de  Newton  para  encontrar  las  raíces  de  una  función  de 
variable  compleja  nos  lleva,  de  forma  natural,  a  pensar  también  en  el  método  de  Newton  para 
encontrar  las  raíces  de  una  función  vectorial  de  dos  variables  /  :  M2  — >  M2.  En  este  caso,  el 
método  de  Newton  admite  unas  interesantes  interpretaciones  geométricas,  como  puede  verse 
en  [1]  y  [152],  Volviendo  al  punto  de  vista  histórico,  fue  el  propio  Simpson  quien  estudió  por 
primera  vez  un  sistema  de  dos  ecuaciones  transcendentales.  En  el  sexto  de  sus  ensayos,  escritos 
en  1740,  Simpson  describe  la  técnica  para  resolver  sistemas  no  lineales  de  dos  ecuaciones  con 
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Figura  2.9:  Arthur  Cayley  (1821-1895)  y  Ernst  Schróder  (1841-1902),  precursores  en  la 
extensión  del  método  de  Newton  al  plano  complejo. 

dos  incógnitas  usando  lo  que  hoy  en  día  llamamos  el  método  de  Newton  para  sistemas 

F(x)  =  0  con  F  :  Rd  — >  Md. 

De  hecho  (véase  [153]  para  más  detalles),  Simpson  indica  cómo  calcular  los  elementos  de 
la  matriz  jacobiana  F'(x)  para  el  caso  n  —  2  y  la  solución  del  correspondiente  sistema  de 
ecuaciones  F\x)(xn+1  —  xn)  =  —F{;xn)  usando  la  regla  de  Cramer.  Simpson  ilustra  su  técnica 
con  tres  ejemplos.  El  primero  de  ellos,  con  la  notación  actual,  es: 

f  y  +  \¡y2  -  x2  =  ío, 

[  x  +  \J y2  +  x  =  12. 

A  pesar  del  carácter  innovador  del  trabajo  de  Simpson,  éste  no  tuvo  mucha  repercusión  en 
su  época. 

El  problema  de  la  extensión  del  método  de  Newton  al  caso  multidimensional  cayó  en  el 
olvido  hasta  comienzos  del  siglo  XX.  En  1916,  Henry  B.  Fine  y  Albert  A.  Bennet,  ambos 
profesores  de  la  Universidad  de  Princeton,  publicaron  sendos  artículos  On  Newton’s  Method 
of  Approximation  y  Newton’s  method  in  general  analysis  para  sistemas  de  ecuaciones  y  para 
ecuaciones  funcionales  respectivamente.  En  el  trabajo  de  Fine  se  da  un  resultado  de  conver¬ 
gencia  para  el  método  de  Newton  aplicado  a  un  sistema  de  ecuaciones  en  el  cual  no  se  asume 
la  existencia  de  solución,  sino  que  sólo  se  exigen  condiciones  sobre  el  punto  de  partida.  En 
ese  mismo  trabajo,  Fine  afirma  que  no  había  encontrado  anteriormente  resultados  de  este 
tipo  para  funciones  vectoriales.  En  el  trabajo  de  Bennet  se  justifica  el  empleo  del  método  de 
Newton  también  en  el  caso  de  ecuaciones  funcionales,  extendiendo  el  trabajo  de  Fine.  Ambos 
trabajos  resultaron  muy  innovadores  en  una  época  en  la  que  el  análisis  funcional  era  una 
rama  de  las  Matemáticas  que  estaba  dando  sus  primeros  pasos.  De  hecho,  sólo  unos  años  más 
tarde,  en  1932,  Stefan  Banach  introdujo  la  noción  de  espacios  de  Banach  en  su  famoso  libro 
Theorie  des  opérations  linéaires  [9]. 
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Figura  2.10:  Alexander  Markowich  Ostrowski  (1893-1986)  y  Leonid  Vitalievich  Kantorovich 
(1912-1986)  extendieron  el  método  de  Newton  para  operadores  definidos  en  espacios  de 
Banach. 

A  partir  de  ese  momento,  varios  investigadores  muestran  interés  en  la  extensión  del  método 
de  Newton  para  sistemas  de  ecuaciones  y  las  publicaciones  sobre  el  tema  comienzan  a  ser 
numerosas.  Pueden  consultarse  algunas  bibliografías  específicas  sobre  el  método  de  Newton 
([95],  [101])  o  buscar  en  las  bases  de  datos  especializadas. 

Durante  este  período,  destacamos  las  publicaciones  de  Alexander  M.  Ostrowski  [110] 
y  [111],  en  las  que  se  estudian  y  comparan  distintas  condiciones  de  convergencia  dadas  pre¬ 
viamente  por  otros  autores.  Además,  se  dan  estimaciones  del  error  cometido  al  aplicar  el 
método  de  Newton  para  resolver  un  sistema  de  ecuaciones  no  lineales. 

Es  en  este  contexto  cuando  Leonid  V.  Kantorovich  se  plantea  en  [74]  la  extensión  del 
método  de  Newton  para  resolver  ecuaciones  funcionales  definidas  entre  dos  espacios  de  Ba- 
nach.  Con  Kantorovich  se  inicia  el  estudio  «moderno»  del  método  de  Newton  con  numerosas 
publicaciones  interesantes,  tanto  desde  el  punto  de  vista  teórico  como  práctico.  Tal  vez,  po¬ 
dríamos  considerar  como  las  referencias  fundamentales  en  este  campo  los  libros  Functional 
Analysis  in  Normed  Spaces  [76]  y  la  segunda  edición  del  mismo,  Functional  Analysis  [77], 
que  el  propio  Kantorovich,  en  colaboración  con  su  discípulo  G.  P.  Akilov,  publicaron  en  1964 
y  1982,  respectivamente.  En  estos  textos  se  recogen  los  principales  resultados  sobre  el  méto¬ 
do  de  Newton  y  sus  aplicaciones  obtenidos  en  los  artículos  de  investigación  publicados  por 
el  propio  Kantorovich  entre  1934  y  1957,  junto  con  los  conceptos  preliminares  de  Análisis 
funcional  necesarios  para  su  desarrollo.  Aunque  muchas  de  las  ideas  que  subyacen  bajo  la 
expresión  del  método  de  Newton  (2.2)  definido  para  ecuaciones  escalares  se  pueden  extender 
a  operadores  definidos  entre  espacios  de  Banach,  en  el  nuevo  contexto  general  hay  que  tener 
en  cuenta  nuevas  consideraciones.  Por  ejemplo,  si  consideramos  una  ecuación  de  la  forma 
F(x)  =  0,  donde  F  :  X  — >  Y  es  un  operador  definido  entre  dos  espacios  de  Banach  A"  e  Y, 
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la  expresión  de  lo  que  se  conoce  como  método  de  Newton- Kantorovich  queda  de  la  siguiente 
forma: 

xn+i  =  xn  -  F'(xn)~lF{xn),  n  >  0.  (2.4) 

Nótese  que,  en  este  caso,  F'(xn )  es  un  operador  lineal  definido  entre  X  e  Y  y  F'(xn )_1 
denota  a  su  inverso.  En  consecuencia,  en  cada  iteración  del  método  de  Newton-Kantorovich 
hay  que  invertir  un  operador  lineal  o,  equivalentemente,  resolver  la  ecuación  lineal  asociada 
F'(xn)un  =  —F(xn)  para  definir  a  continuación  xn+i  =  xn  +  un. 

El  estudio  detallado  de  la  teoría  de  Newton-Kantorovich  escapa  del  alcance  de  este  texto. 
No  obstante,  el  lector  interesado  en  tener  una  visión  más  general  sobre  dicha  teoría  puede 
consultar  algunos  artículos  de  tipo  descriptivo  como  [46],  [47]  o  [120]. 

A  partir  de  Kantorovich,  el  número  de  investigadores  que  trabajan  sobre  el  método  de 
Newton,  sus  variantes  y  aplicaciones  comienza  a  crecer  vertiginosamente.  Sería  prácticamen¬ 
te  imposible  hacer  un  seguimiento  detallado  de  las  contribuciones  de  otros  autores.  Como 
una  pequeña  muestra,  podemos  citar  algunos  de  los  autores  que  han  escrito  monografías 
especializadas  en  el  método  de  Newton  y,  en  general,  en  procesos  iterativos  para  resolver 
ecuaciones  no  lineales:  I.  K.  Argyros  [5],  J.  P.  Dedieu  [40],  J.  E.  Dennis  y  R.  B.  Schnabel 
[41],  A.  S.  Householder  [68],  C.  T.  Kelley  [78],  J.  M.  Ortega  y  W.  C.  Rheinboldt  [109],  A. 
Ostrowski  [112],  F.  A.  Potra  y  V.  Pták  [121],  L.  B.  Rail  [123]  y  J.  F.  Traub  [146].  Consul¬ 
tando  las  propias  referencias  de  estos  textos,  en  trabajos  recopilatorios  como  [120]  o  [151],  en 
sitios  web  especializados  [95]  o  en  bases  de  datos  específicas  sobre  Matemáticas  (Zentralblatt 
MATH,  MathSciNet,  Scopus,  entre  otras)  podemos  ampliar  la  larga  lista  de  investigadores 
con  artículos  publicados  al  respecto. 

2.3.  Construcciones  y  variantes  del  método  de  Newton 

En  la  sección  2.2  ya  se  ha  puesto  de  manifiesto  el  gran  número  de  personas  que  han  influido 
en  lo  que  hoy  conocemos  como  método  de  Newton  para  resolver  ecuaciones  no  lineales.  Con 
lo  anterior,  hemos  narrado  el  inicio  de  lo  que  se  entiende  por  método  de  Newton.  En  esta 
sección  veremos  sus  interpretaciones  y  sus  variantes  en  el  estudio  de  diversos  problemas 
matemáticos.  En  este  listado  no  precisamos  las  condiciones  que  han  de  cumplirse  para  que 
estas  construcciones  puedan  realizarse.  Así,  supondremos  que  las  funciones  que  manejaremos 
son  todo  lo  continuas  y  derivables  que  necesiten  ser. 

■  Construcción  geométrica.  El  método  de  de  Newton  tiene  una  clara  interpretación 
geométrica  basada  en  la  aproximación  de  la  función  f(x)  por  una  recta  tangente  (véase 
la  figura  2.11).  Por  este  motivo,  dicho  método  suele  denominarse  también  método  de 
la  tangente.  Partiendo  de  una  aproximación  inicial  Xq  de  la  solución  a,  la  siguiente 
aproximación,  aq,  se  obtiene  como  la  intersección  de  la  recta  tangente  a  la  función  f(x) 
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Figura  2.11:  Interpretación  geométrica  del  método  de  Newton. 


en  el  punto  x0  con  el  eje  de  abcisas.  Así,  x\  es  la  intersección  de  las  rectas  y  —  f(x0)  = 
f'(x 0)(x  —  Xq)  e  y  =  0,  es  decir,  x\  =  x0  —  f  (x0) / f  (x0) .  Reiterando  este  procedimiento 
se  obtiene  una  sucesión  de  aproximaciones,  que  converge  a  la  solución  y  que  coincide 
con  la  obtenida  mediante  el  método  (2.2). 


■  Construcción  a  partir  del  desarrollo  de  Taylor.  A  partir  de  Xq  buscamos  una 
aproximación  mejor  de  a  que  sea  de  la  forma  x0  +  £■  Lo  ideal  sería  que  f(x o  +  e)  —  0, 
en  cuyo  caso  se  obtendría  la  solución  exacta.  Usando  el  desarrollo  de  Taylor,  llegamos  a 

0  —  f  (a^o  +  e)  =  f  (x0)  +  f(xo)e  +  — -e2  +  — ^ — ^-e3  +  ■  ■  ■  (2.5) 

2  o 

Truncando  (2.5)  en  el  segundo  sumando,  es  decir,  linealizando  la  ecuación,  se  obtiene: 


0  -  f{x o)  +  f(x 0)e  =►  £  ~ 


fM 

f'M' 


De  aquí  se  deduce  la  siguiente  aproximación  de  a:  x0  —  f  (x0) /  f  (x0) .  Reiterando  el 
proceso  obtenemos  el  método  de  Newton  (2.2). 


■  Construcción  a  partir  de  la  interpolación  racional  inversa.  El  problema  de 
aproximar  una  solución  de  (2.1)  se  puede  transformar  en  el  de  aproximar  0(0),  donde 
x  =  4>(y)  denota  la  función  inversa  de  y  =  f(x).  Supongamos  que  xq  es  una  aproxima¬ 
ción  inicial  de  la  solución  a  y  sea  yo  =  f{x o).  Considerando  el  desarrollo  de  Taylor  de 
orden  uno  de  la  función  0(j/)  en  torno  al  punto  yo, 

0(0)  ~  00/o)  -  4>'(yo)yo  =  x0-  y, 

se  obtiene  una  nueva  aproximación  para  a  =  0(0)  que  coincide,  una  vez  más,  con  la 
expresión  del  método  de  Newton  (2.2). 


2.3.  Construcciones  y  variantes  del  método  de  Newton 
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■  Construcción  usando  fórmulas  de  cuadratura.  El  método  de  Newton  también  se 
puede  construir  a  partir  de  fórmulas  de  integración  numérica  de  tipo  interpolatorio.  En 
concreto,  si  tenemos  en  cuenta  la  representación  integral 

f(x)  =  f(x0)  +  í  f'(t )  dt 

Jx0 

y  usamos  la  fórmula  de  cuadratura  de  Newton-Cotes  de  los  rectángulos  a  izquierda, 

[  f{t)dt~(x-x0)f(x0), 

llegamos  a  que  la  solución  de  la  ecuación  f(x)  —  0  puede  aproximarse  por  la  solución 
de  la  ecuación  f(x  0)  +  (x  —  xq  )f(xo)  =  0,  lo  que  conduce  de  nuevo  al  método  (2.2). 

■  El  método  de  Newton  continuo.  El  método  de  Newton  (2.2)  puede  obtenerse  tam¬ 
bién  usando  el  método  de  Euler  explícito  para  aproximar  la  solución  de  la  ecuación 
diferencial 

At)  =  -7 H?  ¡  J  °'  (2ii) 

En  efecto,  si  se  considera  la  condición  inicial  x(t0)  =  x0  y  se  toma  como  paso  de 
integración  h  —  1,  el  método  de  Euler  define  una  sucesión  que  coincide  con  la  dada  en 
(2.2).  La  ecuación  (2.6)  se  conoce  como  método  de  Newton  continuo  y  ofrece  interesantes 
interpretaciones  desde  el  punto  de  vista  dinámico.  En  concreto,  si  x(t)  es  una  solución 
de  la  ecuación  (2.6)  que  cumple  x'{t)  — >  0  cuando  í  — >  oo  se  tiene  que  x(t)  «fluye»  a 
una  solución  de  la  ecuación  (2.1). 

Pero  no  solo  son  elevados  el  número  de  investigadores  que  han  trabajado  sobre  el  método 
de  Newton  y  las  posibles  derivaciones  de  dicho  método.  Los  temas  y  aplicaciones  que  se 
han  abordado  son  numerosos  y  diferenciados  entre  sí.  La  siguiente  lista  es  sólo  una  pequeña 
muestra  de  tópicos  relacionados  con  el  método  de  Newton. 

■  Variantes  de  las  condiciones  de  convergencia  del  método  de  Newton-Kan- 
torovich.  De  una  forma  muy  esquemática,  la  teoría  de  Newton-Kantorovich  asegura 
la  convergencia  del  método  (2.4)  bajo  condiciones  que  involucran  al  punto  de  partida 
x0  y  al  operador  F  y  sus  derivadas.  Dependiendo  de  las  condiciones  exigidas  se  pueden 
obtener  dominios  de  puntos  de  partida  xq  más  o  menos  amplios.  Sobre  este  aspecto  se 
profundizará  un  poco  más  en  la  sección  2.4. 

■  Métodos  de  tipo  Newton  y  métodos  con  orden  de  convergencia  alto.  Cuando 
se  emplean  procesos  iterativos  para  resolver  una  ecuación  no  lineal  siempre  hay  que 
buscar  un  equilibrio  entre  el  coste  computacional  que  conlleva  el  proceso  y  su  velocidad 
de  convergencia.  En  general,  los  métodos  con  una  mayor  velocidad  de  convergencia  lle¬ 
van  asociados  un  coste  computacional  alto  y  viceversa.  Bajo  unas  condiciones  bastante 
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generales,  se  puede  probar  que  el  método  de  Newton  tiene  convergencia  cuadrática 
(véase  la  definición  de  orden  de  convergencia  en  la  definición  2.1).  Esto  quiere  decir 
que  el  número  de  cifras  significativas  en  el  proceso  de  aproximar  la  solución  se  va  mul¬ 
tiplicando  por  dos  en  cada  paso.  Aunque  el  método  de  Newton  se  puede  considerar 
como  suficientemente  rápido,  existen  otros  métodos  (Halley,  Chebyshev,  súper-Halley, 
etc.)  con  convergencia  cúbica  o  superior.  Todos  estos  métodos  tienen  una  interpretación 
geométrica  similar  a  la  del  método  de  Newton,  como  puede  verse  en  [4],  La  expresión 
de  las  correspondientes  funciones  de  iteración  es  la  siguiente: 


1.  Método  de  Halley: 


^n+1  %n 


2  f(xn) 

2  -  Lf(xn)  /'(x,,)’ 


2.  Método  de  Chebyshev: 


%n+ 1  %r, 


3.  Método  súper-Halley: 


%n+ 1  %n  1  “1“  0 


1  Lfixn )  \  f{xn) 


2  1  -  Lf(xn) )  f'(xny 


donde  en  estas  fórmulas  hemos  denotado 

í'(Xn)2 


(2.7) 


(2.8) 


(2.9) 


(2.10) 


Por  otro  lado,  también  existen  métodos  que  sacrifican  una  velocidad  de  convergencia 
elevada  por  un  menor  coste  operacional,  como  por  ejemplo  el  denominado  método  de 
Newton  simplificado : 


^n+1  %n 


f(xn) 

f'(x  o)’ 


o,  en  general,  métodos  del  tipo 


%n+l  %n  QjnJ\Xn)'> 

donde  an  son  parámetros  que,  de  alguna  forma  u  otra,  aproximan  a  1  / f\xn).  Este 
segundo  tipo  de  métodos  adquieren  especial  importancia  cuando  se  considera  la  formu¬ 
lación  más  general  del  método  de  Newton-Kantorovich  (2.4): 


%n+ 1  %n 


A-nF  (xn)  j 


donde,  en  este  caso,  An  son  operadores  lineales  que  aproximan  al  inverso  del  operador 
F'(xn). 


2.3.  Construcciones  y  variantes  del  método  de  Newton 
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■  Métodos  multipunto  y  métodos  de  tipo  secante.  El  método  de  Newton  es  un 
ejemplo  de  lo  que  se  conoce  como  método  de  un  paso,  en  el  cual  el  iterado  xn+\  se 
obtiene  a  partir  del  anterior,  xn.  Existen  otros  métodos  que  utilizan  la  información  de 
un  mayor  número  de  pasos  anteriores  ( xn,xn-i . .  .xn_p)  para  definir  el  iterado  xn+\. 
Sin  duda,  el  más  famoso  de  estos  métodos  es  el  conocido  como  método  de  la  secante: 


%n—  1  j.  /  \ 

xn+l  =  %n  V7  \  77  \J\xn) 

f\Xn)  ~  f{xn- 1) 


Nótese  que  se  trata  de  un  método  de  dos  pasos  en  el  que  se  ha  evitado  el  tener  que 
evaluar  la  derivada  primera  f'{x).  En  líneas  generales  este  tipo  de  métodos  busca  re¬ 
ducir  el  coste  operacional,  aún  a  costa  de  perder  velocidad  de  convergencia.  En  el  caso 
particular  del  método  de  la  secante  se  alcanza  una  convergencia  superlineal  (de  orden 
(l  +  V5)/2)),  sin  alcanzar  la  convergencia  cuadrática  del  método  de  Newton  (se  define 
orden  de  convergencia  en  la  definición  2.1). 


■  Métodos  para  raíces  múltiples.  Es  bien  conocido  que  las  propiedades  del  método 
de  Newton  cambian  cuando  se  aplica  para  aproximar  raíces  múltiples.  En  concreto,  la 
velocidad  de  convergencia  pasa  de  cuadrática  a  lineal.  Existen  diversas  variantes  del 
método  de  Newton  que  permiten  recuperar  la  convergencia  cuadrática.  Por  ejemplo, 
cuando  se  trata  de  aproximar  una  raíz  de  multiplicidad  p,  el  método 

„/(^n) 

xn+ 1  Xn  P  rri’  \  i 

f  M 

converge  cuadráticamente  a  dicha  raíz.  Pero  este  método  tiene  algunos  inconvenientes. 
De  entrada,  la  multiplicidad  de  la  raíz  no  es  conocida.  Además,  aunque  la  convergencia 
es  cuadrática  hacia  la  raíz  múltiple  considerada,  pierde  la  convergencia  cuadrática  al 
aproximar  al  resto  de  raíces.  Otra  posibilidad  es  aplicar  el  método  de  Newton  a  la 
función  g(x)  =  f{x)/f'{x).  Se  obtiene  así  el  siguiente  método,  atribuido  a  Schróder 
(1870): 

_ _ 1  f(xn) 

Xn+1  Xn  1  -  Lf(xn)  f'(xny 

con  Lf(x )  definido  en  (2.10),  que  conserva  la  convergencia  cuadrática  incluso  para  raíces 
múltiples.  Por  último,  hay  que  destacar  que  la  situación  se  complica  cuando  se  pasa  de 
ecuaciones  con  una  variable  al  caso  multidimensional. 


■  Estudio  dinámico  del  método  de  Newton.  El  método  de  Newton  puede  consi¬ 
derarse  como  un  sistema  dinámico  discreto.  Como  tal,  el  estudio  de  las  órbitas  de  los 
diferentes  punto  de  partida  puede  dar  lugar  a  toda  la  casuística  propia  de  este  tipo  de 
problemas:  convergencia  a  un  punto  fijo  (que  es  una  solución  de  la  ecuación  considera¬ 
da),  aparición  de  ciclos  atractores  y  repulsores,  comportamiento  caótico,  etc.  En  el  caso 
particular  de  aplicar  el  método  de  Newton  a  funciones  definidas  en  el  campo  complejo, 
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las  gráficas  de  las  cuencas  de  atracción  asociadas  a  las  diferentes  soluciones  tienen  una 
atractiva  estructura  fractal,  como  se  puede  muestra  más  adelante  en  el  capítulo  4. 


La  versión  continua  del  método  de  Newton.  Hace  referencia  al  problema  de  valor 
inicial 

xut)  =  IMS 

rr(0)  =  x0. 

Dicho  problema  se  puede  resolver  mediante  diversos  métodos  numéricos.  Por  ejemplo, 
cuando  se  considera  el  método  de  Euler  explícito  con  un  paso  de  integración  de  h  —  1, 
se  obtiene  la  misma  sucesión  obtenida  por  el  método  de  Newton  aplicado  a  la  ecuación 
f(x)  =  0.  Si  se  considera  un  paso  de  integración  h  G  (0,1],  se  obtiene  el  denominado 
método  de  Newton  amortiguado : 

fM 


*^n+ 1  h 


}'{xr 


Si  en  lugar  de  un  paso  de  integración  h  constante,  se  consideran  pasos  adaptativos  hn 
se  puede  lograr  una  estrategia  de  convergencia  global. 


■  Métodos  para  el  cálculo  simultáneo  de  las  raíces  de  una  ecuación  (método 
de  Weierstrass).  El  problema  de  encontrar  las  raíces  aq , ,an  de  un  polinomio 

n 

p(z)  =  zn  +  a1zn  +  •  •  •  +  an—\z  +  an  =  —  cq)  (2.11) 

i=  1 

cuyos  coeficientes  pueden  ser,  indistintamente,  números  reales  o  complejos,  puede  trans¬ 
formarse,  mediante  las  fórmulas  de  Cardano,  en  resolver  el  siguiente  sistema  de  ecua¬ 
ciones  no  lineales: 


fi(z1,...,zn)  =  (-iy4>i(z1,...,zn)-ai  =  0,  i  1,. (2.12) 
donde  son  las  funciones  simétricas  elementales: 

<f>i(zU  •  ■  ■  ,  Zn)  =  Z3i---Z3i- 

1  <jl<—<ji<n 

Resolviendo  el  sistema  (2.12)  encontramos  simultáneamente  todas  las  raíces  del  poli¬ 
nomio  p.  Se  puede  emplear  el  método  de  Newton  para  resolver  dicho  sistema.  Así,  a 
partir  de  un  vector  Z ^0)  =  (zf^, . . . ,  z^j) )  se  construye  la  siguiente  sucesión: 

^(k+i)  _  gík)  _  f' (z^)-1  F (Z^) . 

Es  bien  conocido  que  la  expresión  anterior  admite  una  formulación  equivalente,  que 
permite  calcular  las  iteraciones  de  forma  explícita,  sin  necesidad  de  trabajar  con  la 
matriz  F'(Z^).  En  concreto, 

Z(k+i)  =  Z(k)  _  (p(zW)/n«  . . .  ,p(4D)/nW)T;  i  =  1, . . .  ,n,  k  =  0, 1,2, . . . 
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donde 


3  =  1 


Esta  expresión  también  puede  escribirse  componente  a  componente: 


3  =  1 
3 


Este  proceso,  inicialmente  atribuido  a  Weierstrass  (1.903),  recibe  su  nombre  y  también 
el  de  otros  matemáticos  que  han  trabajado  sobre  él:  Durand  (1.960),  Kerner  (1.966), 
Dochev  (1.962),  etc.  Los  nombres  de  método  de  Weierstrass  o  método  de  Durand-Kerner 
son  bastante  habituales  en  la  literatura  matemática. 

■  Métodos  para  resolver  sistemas  de  ecuaciones  subdeterminados  (inversos 
generalizados).  En  esta  ocasión  se  trata  de  aplicar  alguna  variante  del  método  de 
Newton  para  resolver  un  sistema  del  tipo  F(x)  =  0,  con  x  G  Mn  y  F  =  (/i, . . . ,  fm),  es 
decir  F  :  Mn  — >  Mm,  con  m  <  n.  Se  trata,  por  tanto,  de  un  sistema  con  más  incógnitas 
que  ecuaciones.  En  condiciones  adecuadas,  el  conjunto  de  ceros  de  F,  V  =  F_1(0),  es 
una  subvariedad  de  MA  de  dimensión  n  —  m  que  se  puede  aproximar  numéricamente 
iterando  la  función 

Nf(x)  =  x  —  F'(x)^F(x), 

donde  F'(xy  es  el  inverso  generalizado  (o  inverso  de  Moore-Penrose)  del  operador 
lineal  F'(x).  Dada  una  matriz  A  e  Mmxn,  su  inverso  generalizado  AC  e  1 Rnxm  es  la 
única  matriz  que  cumple  las  propiedades  AA'A  =  A,  A^AA^A  =  A\  ( AA f)7  =  AA3  y 
(A5 A)1  =  A^A,  donde  AT  denota  la  matriz  traspuesta  de  A. 

■  Métodos  para  resolver  sistemas  de  ecuaciones  sobredeterminados  (método 
de  Newton-Gauss).  El  problema  considerado  es  el  de  resolver  un  sistema  de  ecuacio¬ 
nes  con  más  ecuaciones  que  incógnitas.  Es  ésta  una  situación  que  aparece  con  frecuencia 
en  la  práctica,  como  por  ejemplo  en  el  ajuste  de  una  nube  de  puntos  (no  alineados)  por 
una  recta  de  regresión.  Al  no  existir  una  solución  del  problema,  se  introduce  un  nuevo 
concepto  de  solución:  la  solución  por  mínimos  cuadrados.  En  concreto,  si  escribimos 
el  sistema  como  F(x)  =  0,  con  x  G  Mn  y  F  =  (fi, . . . ,  fm),  ( m  >  n ),  el  problema  de 
resolver  la  ecuación  F(x)  =  0  se  transforma  en  el  de  minimizar  el  funcional 

-i  m 

G(x)  =  dl^O^II2  =  ¿ 

3= 1 

El  problema  de  encontrar  el  mínimo  absoluto  de  G  es,  a  priori,  difícil  de  resolver.  En 
consecuencia,  se  suele  abordar  el  problema  de  encontrar  los  mínimos  locales  de  G. 
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Para  ello  hay  que  encontrar  los  puntos  críticos  de  G  como  soluciones  del  sistema  de 
ecuaciones  G'{x)  =  0.  Cuando  se  trata  de  un  sistema  con  el  mismo  número  de  ecuaciones 
que  de  incógnitas,  se  puede  emplear  el  método  de  Newton  o  cualquiera  de  los  métodos 
habituales  para  resolver  este  tipo  de  sistemas. 

Otra  estrategia,  introducida  por  Gauss  en  1809,  consiste  en  linealizar  el  sistema  inicial 
F(x)  =  0  de  la  forma  F(x)  +  F'(x)(y  —  x )  =0.  Para  el  caso  en  el  que  el  operador  F'(x) 
sea  inyectivo,  la  solución  por  mínimos  cuadrados  de  este  sistema  admite  una  expresión 
de  la  forma 

y  =  x-  ( F\x)TF'(x))-lF\x)TF{;x ). 

La  iteración  de  este  proceso  da  lugar  a  lo  que  se  conoce  como  método  de  Newton- 
Gauss.  Este  problema  tiene  unas  características  totalmente  diferentes  a  las  del  caso 
subdeterminado.  En  concreto  la  convergencia  del  método  de  Newton-Gauss  a  un  punto 
límite  no  garantiza  que  éste  sea  una  solución  del  sistema  F(x)  =  0,  pudiendo  ser 
también  un  punto  crítico  del  funcional  G  definido  anteriormente. 

■  Optimización  con  y  sin  restricciones.  Muy  vinculado  al  punto  anterior  está  el 
problema  de  minimizar  un  funcional  del  tipo  mín  f(x),  donde  /  está  definido  en  un 
subconjunto  de  Mn.  Este  problema  puede  transformarse,  en  condiciones  adecuadas,  en 
resolver  la  ecuación  V/(x)  =  0.  La  aplicación  del  método  de  Newton  a  este  problema 
da  lugar  a  la  sucesión 

xn+ 1  xn  Hf(.Xn')  Vy(xn), 

donde  V/  y  Hf  denotan,  respectivamente,  al  vector  gradiente  y  a  la  matriz  hessiana 
del  funcional  /.  Además  algunos  problemas  de  optimización  con  restricciones,  como  los 
obtenidos  cuando  las  restricciones  vienen  dadas  por  un  conjunto  de  igualdades  también 
pueden  resolverse  por  el  método  de  Newton.  Por  ejemplo,  las  soluciones  del  problema 

mín/(x),  con  g{x)  =  0, 

siendo  /  :  fn  — »  R.  y  g  :  Mn  — »  Mm,  se  encuentran  entre  los  puntos  críticos  de  la 
correspondiente  función  de  Lagrange  L  :  M"  x  — >  R.  definida  por 

L{x,y)  =  f{x)  +  y±gi{x)  H - b  ymgm(x),  x  eRn,  ye  Rm, 

donde  y  G  Mm  es  un  vector  formado  por  los  multiplicadores  de  Lagrange  y  cq, . . . ,  gm 
son  las  funciones  componentes  de  g.  En  este  caso,  se  tendría  que  aplicar  la  versión 
general  del  método  de  Newton  (2.4)  para  resolver  el  sistema  de  ecuaciones  no  lineales 
dado  por 

L'x(xiy)  =  °i  L’y{x,y)  =  o. 

Este  tipo  de  problemas  se  puede  extender  a  resolver  problemas  de  cálculo  de  variaciones, 
minimizando  funcionales  definidos  en  un  espacio  de  Hilbert. 
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■  Métodos  para  resolver  ecuaciones  no  diferenciables.  En  el  estudio  teórico  de 
la  convergencia  del  método  de  Newton  para  resolver  una  ecuación  no  lineal  F(x)  = 
0  es  habitual  exigir  la  diferenciabilidad  del  operador  involucrado  F,  junto  con  otro 
tipo  de  condiciones.  En  ocasiones,  hay  que  trabajar  con  ecuaciones  del  tipo  F(x)  = 
G(x )  +  H{x)  =  0  donde  G  es  la  parte  diferenciable  y  H  la  parte  no  diferenciable  del 
operador  inicial  F .  Para  este  tipo  de  problemas  se  puede  usar  una  variante  del  método 
de  Newton  que  sólo  toma  en  consideración  la  parte  diferenciable  a  la  hora  de  calcular 
el  correspondiente  inverso,  lo  que  da  lugar  al  siguiente  tipo  de  iteraciones,  formuladas 
en  su  versión  más  general: 

Xn+ 1  Xn  G  (xn)  F(xn )  Xn  G  (xn)  [G(xn^)  ~\~  H^Xji)]. 

■  Implementaciones  computacionales  del  método  de  Newton.  Una  cosa  es  el  es¬ 
tudio  de  un  método  numérico  desde  el  punto  de  vista  teórico  y  otra  muy  distinta  es 
su  aplicación  en  determinados  problemas  reales.  Al  tratar  un  problema  computacional- 
rnente  hay  que  tener  en  cuenta  factores  como  el  acceso  libre  a  los  códigos,  el  tiempo 
de  cálculo,  el  almacenamiento  de  los  datos  y  también  el  tiempo  que  necesita  el  usuario 
para  plantear  y  resolver  el  problema.  Muchos  de  los  programas  de  cálculo  simbólico 
o  numérico  más  empleados  (Mathematica,  Matlab,  Maple,  Derive,  Octave,  Maxima, 
Sage,  etc.)  tienen  incorporadas  funciones  que  calculan  de  forma  aproximada  las  solu¬ 
ciones  de  una  ecuación  no  lineal.  Dichas  funciones  usan  el  método  de  Newton  y  sus 
variantes.  Además,  se  puede  acceder  a  los  códigos  de  algoritmos  que  implementan  el 
método  de  Newton  en  diversos  lenguajes  de  programación  (C,  C++,  FORTRAN,  etc.). 
Actualmente,  Internet  ofrece  un  gran  número  de  posibilidades  para  acceder  a  este  tipo 
de  recursos.  Como  una  pequeña  muestra,  citamos  algunas  páginas  web  desde  donde  se 
pueden  descargar  este  tipo  de  programas:  [96],  [104],  [108],  [116],  [130],  [136],  [156]. 
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A  finales  del  siglo  XVII  y  comienzos  del  XVIII  científicos  de  la  talla  de  Newton,  Raphson 
y  Simpson  establecieron  las  bases  de  lo  que  hoy  conocemos  como  método  de  Newton  como 
herramienta  para  resolver  ecuaciones  no  lineales  concretas.  El  propio  Newton  explicaba  el 
procedimiento  para  encontrar  una  solución  de  la  ecuación  x3  —  2x  —  5  =  0  próxima  al  punto 
xq  =  2.  Unos  años  más  tarde,  otros  científicos  como  Mourraille,  Fourier  o  Cauchy  [31]  se 
plantearon  el  problema  de  buscar  las  condiciones  para  que  las  iteraciones  del  método  de 
Newton  (2.2)  converjan  a  una  solución  de  la  ecuación  (2.1). 

En  el  estudio  de  la  convergencia  del  método  de  Newton  y,  en  general,  de  cualquier  proceso 
iterativo  se  distinguen  tres  grandes  teorías: 
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1.  Convergencia  local:  se  imponen  condiciones  sobre  la  función  f(x)  que  define  la  ecuación 
(2.1)  y  sobre  la  solución  a  de  la  misma. 

2.  Convergencia  semilocal:  se  imponen  condiciones  sobre  la  función  f(x )  que  define  la 
ecuación  (2.1)  y  sobre  el  punto  de  partida  xo  de  la  sucesión  (2.2). 

3.  Convergencia  global:  se  exigen  condiciones  sobre  la  función  f(x)  que  define  la  ecuación 
(2.1)  sobre  un  rango  de  valores  donde  está  definida. 

En  esta  sección  presentamos  resultados  de  convergencia  para  el  método  de  Newton  que 
se  enmarcan  dentro  de  cada  una  de  las  líneas  anteriores.  Además,  analizaremos  algunos 
otros  conceptos  relacionados  con  la  idea  de  convergencia  (véase  [68],  [80],  [146]  para  más 
información) . 

Definimos  ahora  uno  de  los  conceptos  más  importantes  en  el  estudio  de  los  procesos 
iterativos,  como  es  el  de  orden  de  convergencia. 

Definición  2.1.  Sea  { xn }  una  sucesión  convergente  a  un  límite  x* .  Si  existe  una  constante 
C  G  (0, 1)  tal  que 

lím  ^  ~Xn+^  =  CS 

n — XX)  o'**  —  qr 

|  | 

se  dice  que  el  orden  de  convergencia  es  lineal. 

Si,  además,  existe  un  número  real  p  y  una  constante  no  nula  C  tal  que 

lím  ~Xn+1\  =  c,  (2.13) 

n — »oo  —  Xny  X 

diremos  que  {xn}  es  convergente  de  orden  p  y  llamaremos  aC  la  constante  de  error  asintótico. 

Cuando  p  =  2,  se  dice  que  la  convergencia  es  cuadrática,  y  cuando  p  =  3,  cúbica.  Cuando 
1  <  p  <  2  el  orden  de  convergencia  se  dice  superlineal. 

A  menudo,  para  resolver  una  ecuación  f(x)  =  0,  se  utiliza  un  proceso  iterativo  xn+\  = 
4>{xn),  donde  (f)  es  un  funcional  que  depende  de  la  función  /.  Si  queremos  asociar  el  concepto 
de  orden  con  el  proceso  iterativo  que  genera  la  sucesión,  podemos  escribir  (2.13)  como  sigue 

;*-<Kx)  I  _c 

x*  —  x\p 

Para  Schróder  [135]  el  proceso  anterior  es  de  orden  p  si 

4>(x*)  =  x*]  (¡)^\x*)  —  0,  j  —  1,  2, . . .  ,p—  1;  cf>(p\x*)  ^  0. 

Esta  definición  solamente  es  válida  para  procesos  iterativos  definidos  por  funciones  de  una 
variable  con  p  derivadas  continuas.  Una  generalización  de  esta  definición  para  sistemas  de 
ecuaciones  puede  verse  en  [146]. 
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Cuando  un  método  iterativo  tiene  orden  de  convergencia  p,  se  tiene  que  en  cada  iteración 
se  multiplica  aproximadamente  por  p,  el  número  de  cifras  exactas  con  las  que  se  aproxi¬ 
ma  la  solución.  De  esta  forma,  un  algoritmo  con  orden  de  convergencia  alto  converge  más 
rápidamente  que  un  algoritmo  de  orden  menor. 

Un  estudio  más  detallado  del  orden  de  convergencia  puede  verse  en  [109],  donde  se  pone 
de  manifiesto  la  relación  entre  el  orden  y  la  velocidad  de  convergencia  de  la  sucesión,  así  como 
la  independencia  de  la  norma  elegida  en  la  definición  de  orden  para  el  caso  de  operadores 
definidos  en  los  espacios  Mn.  En  concreto,  consideramos  dos  procesos  iterativos  <p\  y  0 2  con 
el  mismo  límite  x*  y  órdenes  p\  y  P2,  respectivamente.  Si  p\  <  P2  la  sucesión  generada  por 
02  converge  a  x*  más  rápidamente  que  la  generada  por  0 1.  Además  esto  ocurre  con  cualquier 
norma.  Si  p\  =  P2,  entonces  el  proceso  con  menor  constante  de  error  asintótico  es  el  más 
rápido,  aunque  en  este  caso  no  se  puede  hablar  de  independencia  de  la  norma  elegida. 

En  un  proceso  iterativo  xn+\  =  <p(xn),  el  funcional  0  depende  de  la  función  /.  Por  tanto, 
el  orden  del  proceso  puede  variar  para  distintas  clases  de  funciones  /.  Así,  para  hablar  con 
precisión  deberíamos  decir  que  un  proceso  es  de  al  menos  un  cierto  orden.  Esta  ambigüedad 
queda  suprimida  en  otras  definiciones  de  orden,  como  las  que  dan  Ortega  y  Rheinboldt  [109]. 

La  multiplicidad  de  una  raíz  puede  alterar  el  orden  de  un  proceso  iterativo.  Así,  cuando 
decimos  que  un  proceso  iterativo  es  de  un  cierto  orden  p,  se  entiende  que  esto  es  cierto  para 
los  ceros  de  una  misma  multiplicidad.  Mientras  no  se  diga  lo  contrario,  supondremos  que 
todos  los  ceros  de  las  funciones  que  tratamos  son  de  multiplicidad  uno. 


2.4.1.  Convergencia  local  del  método  de  Newton 


El  teorema  que  presentamos  a  continuación  garantiza  la  convergencia  del  método  de 
Newton  para  puntos  de  partida  suficientemente  próximos  a  la  solución.  Además,  en  el  caso 
de  raíces  simples,  se  demuestra  también  que  la  convergencia  es  cuadrática.  En  el  mismo  se 
introducen  dos  elementos,  la  función  de  iteración  del  método  de  Newton,  Nf(x),  y  su  derivada, 
Lf(x ),  las  cuales  toman  la  forma  siguiente: 


Nf(x) 

LÁX) 


f(x) 

1  /'(*)’ 
f(x)f"(x) 

f'(x)2 


(2.14) 

(2.15) 


Teorema  2.1.  Sea  f  una  función  dos  veces  diferenciable  en  un  entorno  I  de  una  solución 
a  de  f(x)  =  0.  Supongamos  que  f'{x)  0  para  x  G  I .  Entonces  existe  un  valor  r  >  0  tal  que 

si  xq  G  (a  —  r,  a  +  r)  la  sucesión  definida  por  el  método  de  Newton  (2.2), 
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converge  a  a.  Además,  la  convergencia  es  cuadrática,  con  constante  de  error  asintótico 

/"(«) 


C  = 


2 /'(«) 


Demostración.  Teniendo  en  cuenta  que  Nj(t)  =  Lf(t),  podemos  escribir 

ra 

a  -  xn+1  =  a  -  Nf(xn )  =  Nf(a)  -  Nf(xn)  =  Lf(t)  dt. 

Jxn 

Como  Lf(a )  =  0  y  L/(í)  es  una  función  continua  en  I,  existe  r  G  M  tal  que  si  í  6 
(i a  —  r,a  +  r),  entonces  \Lf(t)\  <  7  <  1. 

De  esta  forma,  si  x0  G  (a  —  r,  a  +  r),  entonces 


la  —  aql  < 


Lf(t)dt 


'XQ 


<  q|a  —  xq|  <  r. 


Por  tanto,  X\  G  (a  —  r,  a  +  r). 

Repitiendo  el  razonamiento  de  forma  inductiva,  si  xn  G  (a  —  r,  a  +  r),  entonces 


I®  *^n+l|  — 

y,  por  tanto,  xn+\  G  (a  —  r,  a  +  r). 
Además, 


Lf(t )  dt 


<  7l«  -  "^n  |  <  ri 


\ot  -  Xn+l\  <  7l«  -  ^n|  <  7  F  -  ^n-l|  <  '  '  '  <  7n+  l«  “  ^o|- 


Luego,  para  todo  a:0  G  (a  —  r,  a  +  r), 


lím  xn+i  =  a. 

n— >00 

La  convergencia  cuadrática  del  método  de  Newton  se  deduce  del  hecho  de  que,  para 
raíces  simples  Nf(a )  =  a,  Nj(a)  =  0  y  N'j(a)  =  f"(a)/f'(a).  Notemos  que,  en  este  caso,  la 
constante  de  error  asintótico  para  el  método  de  Newton  es 

r  /» 

2 /'(a)’ 

□ 

El  teorema  anterior  nos  garantiza  la  existencia  de  un  radio  r  para  el  cual  se  asegura  la 
convergencia  del  método  de  Newton  si  empezamos  a  iterar  en  puntos  Xq  cuya  distancia  a  la 
solución  sea  menor  que  dicho  r.  Esta  misma  idea  se  puede  generalizar  al  método  de  Newton- 
Kantorovich  (2.4)  e,  incluso,  se  puede  dar  una  estimación  de  dicho  radio  de  accesibilidad. 
Para  ello,  consideramos  ahora  una  ecuación 


F(x)  =  0,  FTCAA  Y, 


(2.16) 
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siendo  F  un  operador  diferenciable  en  el  sentido  de  Fréchet,  que  está  definido  en  un  dominio 
D  de  un  espacio  de  Banach  X  y  con  valores  en  otro  espacio  de  Banach  Y.  Denotamos  x*  a 
una  raíz  simple  de  F,  es  decir,  tal  que  F'(x*)  tiene  inverso.  Supongamos  que  x*  está  contenida 
en  D.  Un  resultado  clásico  que  se  puede  encontrar  en  [124]  asegura  que  si  F,  además  de  estas 
condiciones,  cumple  la  condición  de  Lipschitz: 

\\F/(xT1[F\x)-F\y)}\\<K\\x-yl  x,y  E  D,  (2.17) 

entonces  el  método  de  Newton-Kantorovich  (2.4)  converge  a  x*  para  todo  Xq  E  B(x*,r )  = 
{x  E  D  \  \\x  —  x0||  <  r},  donde 

2 

1  ~  3 K' 

Dependiendo  de  las  condiciones  exigidas  al  operador,  se  pueden  obtener  nuevas  estimaciones 
para  el  radio  de  accesibilidad  r.  Por  ejemplo,  en  [6]  se  aumenta  dicho  radio  sin  más  que 
precisar  un  poco  más  la  condición  (2.17).  De  hecho,  se  obtiene  el  siguiente  resultado. 

Teorema  2.2.  Sea  F  :  D  C  X  — >  y  un  operador  diferenciable  Fréchet  definido  en  un  dominio 
D  que  contiene  a  una  raíz  simple  x*  de  F.  Supongamos  que,  además  de  la  condición  (2.17), 
se  sabe  también  que 

||F,(x*)_1[F,(x)  —  F/(:r*)]||  <  L\\x  —  x*||,  x  E  D,  (2.18) 


Entonces,  el  método  de  Newton-Kantorovich  {xn}  (■ n  >  0)  generado  por  (2.4)  converge  de 
forma  cuadrática  a  x*  para  todo  punto  de  partida  x0  en  el  interior  de  la  bola  B(x*,r i)  =  {i£ 
D  :  \\x  —  £o||  <  ri},  donde 


r  i  = 


2 

K  +  2L' 


Demostración.  La  demostración  se  basa  en  el  hecho  de  que  la  condición  (2.18),  junto  con  el 
lema  de  Banach  sobre  inversión  de  operadores  [77],  garantizan  que  el  operador  lineal  F'(x) 
tiene  inverso  para  todo  x  E  B(x*,rf).  En  efecto,  como 


F' (x*)~l{F\x)  -  F;(x*)]||  <  Ln  = 


2  L 


se  tiene  que 


F'(x)-lF'(x*)\\  < 


K  +  2  L 

K  +  2  L 


<  1. 


1-2L/(K  +  2L) 


K 


,  x  E  B(x* ,  rf). 


Por  hipótesis,  xo  está  en  el  interior  de  la  bola  B(x*,r\).  Supongamos  que  también  lo  están 
los  puntos  Xk  generados  por  el  método  de  Newton,  para  k  —  0, 1,  2, . . . ,  n.  Veamos  que  xn+\ 
también  lo  está.  En  efecto, 


=  F'{xn)  1  [F(x*)  -  F(xn)  -  F'(xn)(x*  -  xn)] 

=  f  F\xn)~1[F\xn  +  t(x*  ^  xn))  -  F'(xn)\(x*  —  xn)dt 
Jo 


^n+1  % 
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2.4.2.  Convergencia  semilocal  del  método  de  Newton 

Cauchy,  en  1829,  fue  el  primero  en  establecer  un  resultado  de  convergencia  para  el  método 
de  Newton  en  el  cuál  no  se  asumía  la  existencia  de  solución  [151].  En  su  lugar,  Cauchy  exigía 
condiciones  sobre  el  punto  de  partida  x0  de  la  sucesión  (2.2).  El  resultado  de  Cauchy  está  en 
la  base  de  lo  que  algo  más  de  un  siglo  después,  el  matemático  soviético  L.  V.  Kantorovich, 
utilizara  para  estudiar  el  método  de  Newton  (2.4)  para  operadores  definidos  entre  dos  espacios 
de  Banach. 

Teorema  2.3.  Sea  f  :  M  — >  M  diferenciable.  Supongamos  que  f'{x o)  ^  0.  Denotamos 
h0  =  -f(x0)/f(x0),  xi  =  x0  +  h0,  Jo  =  [xi  -  \ho\,xi  +  \h0\]  y  M  =  supxeJo  | f"{x)\.  Si 

f(x0)M 

entonces,  la  ecuación  f(x)  =  0  tiene  una  única  solución  en  Jo  y  el  método  de  Newton  (2.2) 
empezando  en  x0  converge  a  dicha  solución. 

Nosotros  omitimos  aquí  la  demostración  de  este  resultado,  ya  que  éste  puede  considerarse 
como  la  versión  escalar  del  teorema  de  Kantorovich,  que  enunciamos  unas  líneas  más  abajo. 
Además,  el  lector  interesado  puede  encontrar  la  demostración  de  este  resultado  en  [112]. 

En  1948,  L.V.  Kantorovich  probó  la  convergencia  del  método  para  operadores  definidos 
en  espacios  de  Banach.  En  esta  primera  demostración,  Kantorovich  definía  un  conjunto  de 
sucesiones  reales  que  controlaban  el  comportamiento  de  la  sucesión  definida  en  espacios  de 
Banach.  Un  año  más  tarde,  en  1949,  el  propio  Kantorovich  presentó  una  nueva  demostración 
usando  por  primera  vez  sucesiones  mayorizantes. 

Se  dice  que  una  sucesión  de  números  reales  {tn}  mayoriza  a  una  sucesión  { xn }  definida 
en  un  espacio  de  Banach  X  si 


Xn  ||  E:  tn+ 1  tn, 


n  >  0. 
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El  interés  de  las  sucesiones  mayorizantes  es  que  de  su  convergencia  se  puede  deducir  la 
convergencia  de  la  sucesión  en  el  espacio  de  Banach.  En  efecto,  si  {ín}  converge  a  t* ,  entonces 
existe  i*  6  I  de  manera  que  la  sucesión  { xn }  converge  ai*  y  además 

||x*  —  xn\\  <  t*  —  tn,  n  >  0. 

Esta  desigualdad  nos  permite  obtener  cotas  del  error  para  la  sucesión  definida  en  espacios  de 
Banach  en  términos  de  su  correspondiente  mayorizante. 

Consideramos  ahora  una  ecuación 


F(x)  =  0  (2.19) 

donde  F  es  un  operador  difcrenciablc  Fréchet  definido  entre  dos  espacios  de  Banach  X  e  Y. 
El  método  de  Newton  para  resolver  (2.19)  se  define  como 

xn+i  =  xn  -  F'(xn)~1F(xn),  n>  0.  (2.20) 

Los  resultados  que  vamos  a  exponer  a  continuación  dan  condiciones  suficientes  (que  se 
conocen  como  condiciones  de  Kantorovich )  para  que  los  términos  de  la  sucesión  {xn}  definida 
en  (2.20)  estén  bien  definidos  (es  decir,  para  cada  n  e  N  exista  el  inverso  del  operador 
F'(xn)).  Además,  aseguran  la  convergencia  de  {xn}  a  una  solución  x*  de  la  ecuación  (2.19), 
proporcionan  acotaciones  del  error  cometido  en  cada  paso  y  determinan  los  dominios  donde 
la  solución  está  localizada  y  donde  es  única. 

Teorema  2.4  (Kantorovich,  [77]).  Sea  F  :  Í1  C  X  — >  Y  un  operador  diferenciable  Fréchet 
en  un  conjunto  convexo  y  abierto  Í2  de  un  espacio  de  Banach  X .  Supongamos  también  que 
se  cumplen  las  siguientes  condiciones: 

(i)  Existe  un  punto  xq  G  Í2  doride  está  definido  el  operador  r0  =  F'(x o)-1; 

(ii)  ||r0(F,(x)  —  F'(y))\\  <  7||x  —  y\\,  x,yeü,  7  >  0; 

(iü)  ||rOJF(a:o) ||  <  P; 

(iv)  h  =  (31<  1/2; 

(v)  S  =  {x  :  ||a;  —  x0||  <  t*}  C  Q  donde 

t-  =  1 zifiEEf,. 

h 


Eritorices: 

(1)  La  sucesión  de  Newton  (2.20)  está  bien  definida  y  es  convergente  a  una  solución  x*  de 
la  ecuación  (2.19). 
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(2)  La  solución  está  contenida  en  la  bola  de  centro  xq  y  radio  t* ,  B(xo,t*),  y  es  única  en 
B(xo,t**)  siendo 


t**  = 


(3)  Se  tienen  las  siguientes  cotas  del  error: 


Demostración.  El  estudio  de  la  convergencia  del  método  de  Newton  lo  haremos  en  tres  etapas: 

1.  La  sucesión  está  bien  definida  y  es  convergente  a  una  solución  de  F(x)  =  0. 

2.  Obtención  de  cotas  del  error. 

3.  Dominio  de  unicidad  de  solución. 

En  primer  lugar,  veamos  que  la  sucesión  está  bien  definida  y  es  convergente  a  una  solución 
de  la  ecuación  F(x)  =  0.  Así,  observamos  que  dado  x  G  S, 

II /  -  r0F'{x)\\  =  ||r0[F'(x)  -  F\x o)]||  <  7||x  -  x0|| 

<  tí*  =  1  -  Vi  -  2 h  <  1. 

Entonces,  por  el  lema  de  Banach  sobre  inversión  de  operadores,  deducimos  que  existe  [T o  F'(x)¡  1 
y  además 


ll[FoF/(a;)]-1||  < 


(2.2!) 


"L  ”  v  /J  "  -  I-tIIx-xqII  “1-7 1*  x  ' 

En  consecuencia,  tenemos  que  el  operador  F'W1  existe  para  todo  x  G  S  y  así,  la  función 
G(x)  =  x  —  F'(x)~1F(x)  que  genera  el  método  de  Newton  está  bien  definida  para  todo  x  G  S. 
En  particular,  como  xq  G  S ,  G(x o)  =  x\  está  bien  definido  y  además 

Iki  -  x0||  =  ||r0F(x0)  ||  <  ¡3  <  t*  =  - - ^  2hf3, 

ya  que  h  <  1  —  a/1  —  2 h  para  todo  h  G  M.  Por  tanto,  x\  G  S  y  podemos  definir  X2  =  G(x i). 
Además,  teniendo  en  cuenta  (2.21), 

llxs -aq||  =  ||F/(x1)"1F(x1)||  <  ||[roF(x1)]-1||||r0F(x1)|| 


2 1-yiiJl-Jon|ir°^.)ii- 


Ahora  bien,  de  (2.20)  se  deduce  que 


F\xq){x i  -  x0)  +  F(x0)  =  0, 
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luego 


F(Xl)  =  F(Xl)  -  F{x o)  -  F'(x0)(xi  -  x0)  =  fXl[F'(x)  -  F'{x0 )]  dX 

Jx  o 

=  í  [F,(xo  +  t(xi—Xo)}<**F'{xo)](x1<-x0)dt. 

Jo 

Así,  tomando  normas  en  la  igualdad  anterior  y  teniendo  en  cuenta  que  F'(x)  satisface  una 
condición  de  Lipschitz,  se  llega  a 


|r0F(x,)ll  = 


/  r0[F'(i0  +  í(x  1  -  Xo))  -  F\x o)](xi  -  x0)(lt 
Jo 


En  definitiva, 


<  qllxi  -  x0||2  /  tdt  =  ^-\\x1  -  x0 


I x2-xA\<1._  H"1.-"0112  ..  <  hP 


2  1-7||a;i -x0||  2(1 -Ti) ' 

Para  encontrar  una  sucesión  que  mayorice  a  {xn},  vamos  a  considerar  el  polinomio 

P(t)  =  ~t  +  p. 

Es  inmediato  comprobar  que  este  polinomio  cumple  las  condiciones  de  Kantorovich.  Además, 
el  método  de  Newton 

U)  =0, 

P(tn) 


?n+l 


p'(t 


genera  una  sucesión  creciente  cuyo  límite  es  t*,  la  menor  raíz  de  p{t)  =  0. 
Podemos  observar  que 

í  í  -  P<0)  -  B 

~W)  ~  ’ 


luego  ||x!  -  x0||  <  ¡3  =  íi  -  í0. 
También  es  cierto  que 


J-2  ~  t\  — 


P{t  1 


h¡3 


p'(íi)  2(1  -  h) 

y,  por  tanto,  \\X2  —  aq||  <  ¿2  —  ti- 

¿Será  esto  cierto  en  general?,  es  decir,  ¿se  cumplirá  que 

H^'n+l  %n\\  C  Jfi+1  Í ni 

para  todo  n  >  0? 

Supongamos  que  x0,  . . . ,  x¡.  G  S  y  que 

||a;j+i  -  Xi\\  <  ti+ 1  -  ti,  i  =  0, . . . ,  k  -  1. 

Entonces,  usando  (2.21), 

||a;fc+i-xfc||  =  ||F'(xfc)-1F(xfc)||  <  ||[roF/(xfe)]-1||||r0F(xfe)|| 


(2.22) 
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< 


1 

1  -  tI W  -  ®0|| 


r0F{xk)\\. 


Procediendo  como  en  el  caso  k  —  1,  llegarnos  a  que 


(2.23) 


rxk 

F(xk)  =  F(xk )  -  F(xk_i)  -  F'(xk_ i)(xfc  -  xk_i)  =  /  [F\x)  -  F\xk)]  dx 

1 


Tomando  normas, 


[F\xk  +  t(xk 


Xk-1 ))  - 


27- 1)  di. 


r0F(xfe)||  <  -  xk_x\\2  <  |(4  -  4_i)2. 


Luego,  por  (2.23),  y  teniendo  en  cuenta 


(2.24) 


\\xk  -  £o||  <  \\xk  -  2)fc_i||  H - h  ||aq  -  ar0||  <  4  -  4_i  H - f-  4  - 10  =  4, 


se  deduce  que 


Por  otra  parte, 


Además, 


-x*||  < 


7  (4  -  4_i)2 
2  1-74 


4+i  4' 


p(4)  _  p(4) 

p'(tk)  1-74’ 


1  'T 

p(4)  =p(4-i)  +p'(4-i)(4  -4-i)  +  -4-i)2  =  ^(4  -4-i)2- 

Con  esto,  hemos  probado  que  xk+\  G  S  y 


II27+1  27II  4  4+i  4 • 

Entonces,  como  {4}  es  convergente  y,  por  tanto,  de  Cauchy,  se  sigue  que  {a:n}  es  de  Cauchy. 
Como  X  es  un  espacio  de  Banach,  {xn}  es  convergente.  Denotaremos  x*  a  su  límite. 

Haciendo  tender  k  a  infinito  en  (2.24)  se  deduce  que  F(x*)  =  0,  luego  x*  es  solución  de 
(2.19). 


Vamos  a  obtener  cotas  del  error  para  la  sucesión  { xk }  en  función  de  las  cotas  del  error 
para  la  sucesión  {4}.  Como  \\xk+p  —  xk\\  <  tk+p  —  4,  haciendo  p  — >  00,  tenemos: 

\\x*  -  xk\\  <  t*  —  4. 

Las  conocidas  como  fórmulas  de  Ostrowski  [112]  nos  permiten  expresar  el  error  t*  —  4 
en  función  de  las  raíces  del  polinomio  p,  proporcionando  unas  expresiones  muy  cómodas  de 
calcular.  Así,  sean  t*  y  4*  las  soluciones  de  p{t)  =  0.  Denotamos 


Por  último,  vamos  a  analizar  la  unicidad  de  solución.  Sabemos  que 

x*  E  S  =  {x  :  \\x  —  x0||  <  t*}. 

¿En  qué  conjunto  podemos  asegurar  que  es  la  única  solución? 

Supongamos  que  y*  es  otra  solución  de  (2.19)  en 

S  =  {x  :  ||x  —  xo||  <  r}, 

¿cuál  es  el  mayor  valor  de  r  que  podemos  tomar? 

Se  tiene  que 

0  =  r0[F(y*)  -  F(x*)}  =  \  C  r 0F'(X*  +  t(y*  -  x*))  dt  (y*  -  x*) 

Uo  J 

=  M(y*  -  x*). 

Si  el  operador  M  es  inversible,  deducimos  que  x*  =  y*.  Veamos  cuándo  podemos  probar  la 
existencia  de  inverso  para  M.  Por  el  lema  de  Banach,  basta  con  asegurar  que 


I  -  M ||  <  1. 
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Así, 


\I-M\\  = 


/'  r„[F'(i*  +  í(y*  -  x’))  -  F'(x o)]  dt 
Jo 


<í  jWx*  +t(y*  -  x*)  -  x0||  dt  <  í  7  ((l  -  t)\\x*  -  x0\\  +  t\\y*  -  x0\\)  d,t 
Jo  Jo 


<  |[í*  +  r]. 


Buscarnos  el  mayor  valor  de  r  que  cumpla 


es  decir, 


|[t*+r]<l, 


r  = - t*  =  t**. 

7 


En  resumen,  hemos  probado  que  x*  es  la  única  solución  de  (2.19)  en  la  bola 

S  =  {x  :  ||x  —  a;o||  <  t**}. 


□ 


2.4.3.  Convergencia  global  del  método  de  Newton 

Existen  otro  tipo  de  resultados  que  no  exigen,  a  priori,  condiciones  sobre  la  solución  ni 
sobre  el  punto  de  partida.  Entre  éstos  destacan  (véanse  por  ejemplo  las  referencias  [64],  [112] 
o  [146])  las  conocidas  como  condiciones  de  Fourier,  en  las  cuales  se  imponen  condiciones  sobre 
una  función  en  un  intervalo.  No  obstante,  tenemos  que  hacer  notar  que  de  estas  condiciones 
se  deduce  la  existencia  de  una  única  solución  luego,  aunque  sea  implícitamente,  sí  que  se 
están  exigiendo  condiciones  sobre  la  solución. 

Teorema  2.5  (Fourier).  Sea  f  :  [a,  b]  — >  K.  una  función  f  G  C2[a,  6]  que  cumple  las  siguientes 
condiciones: 

1-  f(a)f(b)  <  0. 

2.  f'{x)  t -  0,  para  todo  x  G  [a,  b ]. 

3.  f"(x)  no  cambia  de  signo  en  [a,  b], 

4-  máx{|/(a)///(a)|, \f(b)/f'{b)\}  <  b  -  a. 

EntoJices  existe  una  única  raíz  a  de  la  ecuación  f(x)  =  0  en  [a,  b]  y  la  sucesión  {xn},  definida 
por  (2.2)  converge  hacia  a  para  cualquier  valor  inicial  xq  G  [a,  b]. 
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Figura  2.12:  Las  cuatro  representaciones  gráficas  asociadas  a  las  funciones  que  cumplen  las 
condiciones  del  teorema  de  Fourier. 


Demostración.  La  demostración  se  basa  en  probar  que  el  método  de  Newton  (2.2)  converge 
de  forma  monótona  a  la  solución  a.  Bajo  las  condiciones  del  teorema  se  pueden  presentar 
cuatro  situaciones,  que  son  las  que  se  muestran  en  la  figura  2.12. 

Notemos  que  basta  con  demostrar  la  convergencia  en  una  de  las  cuatro  situaciones,  pues 
el  resto  se  puede  reducir  a  un  mismo  caso  mediante  cambios  de  variable  o  de  función,  tal  y 
como  se  hace  en  [65],  por  ejemplo.  Así,  supongamos  sin  pérdida  de  generalidad  que  f(x)  <  0 
y  f"(x)  >  0  en  [a,b\. 

Entonces,  si  xq  G  [a,  a]  se  tiene  que  {xn}  es  una  sucesión  creciente  y  su  límite  es  la  raíz  a. 
En  concreto,  se  puede  probar  por  inducción  que  las  desigualdades  xn  <  xn+i  <  a  son  ciertas 
para  n  >  0.  Para  ello,  lo  único  que  hay  que  tener  en  cuenta  es  que  en  estas  condiciones, 
f'(x n)  <  0,  f(xn)  >  0  y 


cc  -  xn+1  =  Nf(a)  -  Nf(xn )  =  A}  (7)  (a?  -  xn), 


donde 


AT,f  ^  fh)f" (7)  ^  n  N 

NArr)  =  >  °>  7  e  O&o,  a). 


Como  {xn}  es  una  sucesión  creciente  y  acotada,  tiene  un  límite  que  denotamos  L.  Teniendo 
en  cuenta  que 


L  =  lím  xn+i  =  lím  í  xn  — 


f{Xn) 

f'(xn) 


—  L  — 


m 

f'(LY 


y  que  f'(L )  7^  0,  se  deduce  que  f(L)  =  0  y,  por  tanto,  L  =  a. 

Por  último  si  £  [«,  b]  se  tiene  que  x\  G  [a,  cc)  y  a  partir  de  aquí  la  sucesión  crece 
monótonamente  hacia  la  solución.  En  efecto,  por  una  parte, 


7“  f{x)  -  f\x 0) 

Jx  o  f{x  0) 


dx  >  0, 


a  —  x  1  =  — 
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luego  x\  <  a.  Por  otra  parte,  como  f(b)  <  f(x o)  y  f'{x o)  <  /'(&),  se  tiene  que 
f(b)f(x o)  <  f,(x0)f(x0)  <  f(b)f'(x o)  => 

Por  tanto,  teniendo  en  cuenta  ahora  la  cuarta  de  las  hipótesis  del  teorema, 

,  ^  f(b)  ^  f(x o) 

h-a-m-7M=x°-Xi- 

De  aquí  se  deduce  que  x\  >  a  +  (xq  —  b)  >  a,  tal  y  como  se  quería  probar. 


La  cuarta  condición  del  teorema  anterior  garantiza  qne  aunque  la  primera  iteración  del 
método  de  Newton  pueda  «saltar»  al  otro  lado  de  la  raíz,  en  ningún  caso  se  escapa  del 
intervalo  [a,  b]  considerado.  Como  consecuencia  del  teorema  anterior,  se  puede  dar  el  siguiente, 
resultado  donde  se  elimina  la  cuarta  condición  y  en  su  lugar  aparece  una  condición  sobre  el 
punto  de  partida  que  evita  que  se  produzca  el  «salto»  en  la  primera  iteración. 

Corolario  2.6.  Sea  f  :  [a,  b\  — >  M  una  función  f  G  C2[a,b\  que  cumple  las  siguientes  condi¬ 
ciones: 


1-  f(a)f{b )  <  0. 

2.  f'{x)  ^  0,  para  todo  x  G  [a,  b\. 

3.  f"(x)  no  cambia  de  signo  en  [a,  b\. 

Entonces  existe  una  única  raíz  a  de  la  ecuación  f(x)  =  0  en  [a,  b]  y  la  sucesión  {xn},  definida 
por  (2.2)  converge  hacia  a  para  cualquier  valor  inicial  xq  G  [a,  b]  tal  que  f(xo)f"(xo)  >  0. 


2.5.  El  caso  de  las  raíces  múltiples 

Es  bien  conocido  [146]  que  si  el  punto  de  partida  Zo  está  lo  suficientemente  próximo  a  una 
raíz  de  la  ecuación  f(z)  =0,  el  método  de  Newton 

_  a; -/  \  f  {zn) 

%n+l  %n  ~fil~  V 

J  \Zn) 

converge  a  dicha  raíz.  Además,  se  sabe  que  si  la  raíz  es  simple,  la  sucesión  converge  cuadrá- 
ticamente.  Sin  embargo,  si  la  raíz  es  múltiple,  el  orden  de  convergencia  que  se  obtiene  es  sólo 
lineal. 

Para  el  caso  de  una  función  /  de  variable  real  o  compleja,  diremos  que  a  es  una  raíz 
múltiple  o  un  cero  de  multiplicidad  m  de  /  si 

/(a)  =  /'(a)  =  ...  =  /<’”-1>(Q)=  0  y  /<m)(a)  #  0.  (2.25) 
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En  este  caso,  se  puede  escribir 


/ (x)  =  (x-  a)mg(x),  con  g(a)  ±  0, 
f\x)  =  (x  -  a)m~1(mg(x)  +  (x  -  a)g'(x)), 


/(*) 


=  (x  —  a 


g(x) 


f'(x)  v  mg(x)  +  (x  —  ot)g'(x) 
Entonces  para  valores  de  x  cercanos  a  a  tenemos 


/W  =(X-C)1+£{X) 


f'(x)  m 

Para  1  <  q  <  m  consideramos  el  proceso 


lím  e(x)  =  0. 


«^n+1  %n  Q  nj 


í{Xr, 


fM' 

Para  este  método  se  tiene  que 

xn+i  —  a  =  (xn  —  a)  ( 1  — —  )  —  —  {xn  -  a)e(xn). 

V  mj  m 


(2.26) 


(2.27) 


Por  lo  tanto,  si  q  <  rn  (situación  que  ocurre,  por  ejemplo,  en  el  método  de  Newton  donde 

q  = !), 

lím  (Xr'  ~  =  1  -  í-  ¿  0. 

n— >0°  (xn  —  a)  m 

Por  consiguiente,  se  ha  perdido  la  convergencia  cuadrática  del  proceso,  pudiéndose  garantizar 
únicamente  la  convergencia  lineal. 

Sin  embargo,  si  se  toma  q  =  m,  el  valor  de  la  multiplicidad  de  la  raíz  y  se  supone  que 
/(m+1)(o;)  está  definido,  entonces  el  método 


fM 

xn+1  =  xn  -  m— — r. 

f  M 

recupera  la  convergencia  cuadrática.  Es  más,  en  este  caso, 

(xn+1  -a)  /(m+1)(a) 


(2.28) 


lím 


n— >0°  (xn  —  a)2  (m  +  l)!/(m)(o;) 

Llegados  a  este  punto,  conviene  destacar  que  si  no  se  puede  asegurar  la  existencia  de  /^m+1^(o;), 
únicamente  se  podría  garantizar  la  convergencia  superlineal  del  método  correspondiente.  En 
efecto,  de  la  fórmula  (2.27)  se  deduce 


lím  (*»+i  «) 


=  —  lím  —(x„  —  a)e(xr,)  =  0. 


m 


n-* 00  (xn  —  a) 

Para  recuperar  la  convergencia  cuadrática  se  han  desarrollado  varias  estrategias: 
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1.  Si  se  conoce  que  una  raíz  tiene  multiplicidad  m,  se  puede  aplicar  el  método  (2.28). 
Alternativamente,  este  método  se  puede  obtener  aplicando  el  método  de  Newton  a  la 
función  /(^)1/m.  Se  obtiene  así  una  nueva  función  de  iteración: 


Nm(z)  =  z  - 


(1  /m)f(z)1/m-1f,(z) 


mf(z) 

m  ’ 


que  da  lugar  al  conocido  como  método  de  Newton  relajado.  Como  hemos  indicado  unas 
líneas  más  arriba,  este  método  converge  cuadráticamente  (localmente)  a  la  raíz  con 
multiplicidad  m.  El  resto  de  raíces  pasan  a  ser  puntos  fijos  con  multiplicador  asociado 
1  —  m.  El  mayor  problema  para  la  utilización  de  este  método  es  que  se  necesita  conocer 
a  priori  la  multiplicidad  de  la  raíz  que  se  pretende  aproximar. 


2.  Otra  posibilidad  consiste  en  aplicar  el  método  de  Newton  a  la  función  racional  f(z )  /  f'(z) . 
Observemos  que  las  raíces  de  esta  función  son  simples,  lo  que  garantiza  la  convergen¬ 
cia  cuadrática  del  método  de  Newton  a  todas  las  raíces  de  f(z).  Como  contrapartida, 
observemos  que  se  introducen  también  los  polos  que  provienen  de  las  raíces  de  f'(z ) 
que  no  son  raíces  de  f(z).  El  nuevo  método  obtenido,  conocido  como  método  de  New¬ 
ton  para  raíces  múltiples  o  también  conocido  como  método  de  Schróder,  ( N )  tiene  la 
siguiente  función  de  iteración: 


Ñ(z)  =z- 


i  m 

1~LAÑ  /'(*)’ 


donde 


Lf{z) 


mnz) 

f(z)2 


3.  El  proceso  conocido  como  aceleración  A2  de  Aitken  es  otra  forma  de  acelerar  la  con¬ 
vergencia  del  método  de  Newton  para  raíces  múltiples  y,  en  general,  la  de  cualquier 
proceso  con  convergencia  lineal.  Así,  supongamos  que  {zn}  es  una  sucesión  de  estas  ca¬ 
racterísticas  y  que  z*  es  su  límite.  Denotamos  en  =  zn  —  z*.  Entonces,  por  la  definición 
de  convergencia  lineal,  se  tiene 


lím 

71— XX) 


|en+l  I 

I  I 


A  G  (0, 1). 


Supongamos  que  todos  los  términos  de  la  sucesión  de  errores  {en}  son  del  mismo  signo. 
Para  construir  una  sucesión  que  converja  a  z*  más  rápidamente  que  {zn},  tomemos  n  lo 
suficientemente  grande  para  poder  asegurar  que  en+\  Y  ^n+2  r---/  Aen+i.  Entonces: 


zn+ 2  —  z*  +  en+2  ~  z*  +  Aen+i  —  z*  +  A(zn+i  —  z*).  (2.29) 

De  forma  totalmente  análoga,  también  se  tiene  la  equivalencia 


Zn+ 1  ~  Z*  +  A (Zn  -  Z*). 


2.5.  El  caso  de  las  raíces  múltiples 
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Restando  ambas  equivalencias  se  obtiene  una  estimación  para  A  del  tipo 

>  Z71+ 2  Ai+1 

A  ~  - . 

Zn+1  Zn 


(2.30) 


Entonces,  sustituyendo  (2.30)  en  (2.29)  se  obtiene  una  nueva  aproximación  para  z*  del 
siguiente  tipo: 


*  ZnJr2  A^n_|_i 
z  ~  - - - 7 -  ~  Zn  - 

I  —  A 


(-Ai+1  Ai) 
Z-n+2  2zn+i  -j-  Zr 


El  método  A2  de  Aitken  se  basa  en  el  hecho  de  que  la  sucesión  {zn}  definida  por 


Zv r  Zn 


(Zn+ 1  ~  Zn)2 

Zn+2  2zn+1  A  Zr 


(2.31) 


converge  a  z*  más  rápidamente  que  {zn}.  En  efecto,  en  primer  lugar,  tengamos  en  cuenta 
que  podemos  escribir  en+  \  =  (A  +  6n)en,  con  Sn  — >  0  cuando  n  — >  00.  En  consecuencia, 


Gn+ 2  —  (A  +  án_|_i)en_|_i  —  (A  +  án+l)(A  +  án)cn- 


Ahora  bien,  como 


se  deduce  que 


z  = 


Cn^n+2  en+l 

&n+ 2  2en+i  A  er 


lím  — 

n— >cxo  ^ 

/Jr) 


(A  +  án+i)(A  +  5n )  —  (A  +  ón)2 
(A  +  án+i)(A  +  8n)  —  2(A  +  8n)  +  1 


Esta  última  igualdad  nos  garantiza  que  la  sucesión  {zn}  definida  en  (2.31)  converge  a 
z*  y  además,  más  rápidamente  que  {zn}. 

La  notación  A  asociada  a  este  proceso  tiene  su  origen  en  el  concepto  de  diferencia 
progresiva  de  una  sucesión  {zn}: 


A zn  =  zn+ 1  -  zn,  A kzn  =  Ak  1(Azn),  k>  0. 


Con  esta  notación  el  proceso  definido  en  (2.31)  se  puede  escribir 

.  _  (A^n)2 

Zn  Zn  0 

A2zn 

4.  Para  resolver  una  ecuación  de  la  forma  f(x)  =  0,  donde  f(x)  es  una  función  de  la 
forma  (2.25),  el  método  de  Van  de  Vel  consiste  en  definir  dos  sucesiones,  una  que 
aproxima  a  la  raíz  múltiple,  a,  y  la  otra  a  su  multiplicidad,  m. 

Para  ello,  se  considera  el  proceso  iterativo  (2.26)  y  su  correspondiente  fórmula  del 
error  (2.27).  De  ésta  se  deduce  que 


xn+1  -  a  ~  (1  -  q/m)(xn  -  a) 
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y,  por  tanto, 


a  —  xn 

m  ~  q - 

Xn+ 1  Xn 


El  cociente  indicado  en  la  fórmula  anterior  es,  por  tanto,  una  buena  aproximación  de 
la  multiplicidad  m.  Sin  embargo,  tiene  el  inconveniente  de  involucrar  a  la  raíz  a  en  su 
expresión.  Una  forma  de  solventar  esta  dificultad  es  considerar  una  aproximación  ade¬ 
cuada  para  a  como,  por  ejemplo,  la  proporcionada  por  el  método  A2  de  Aitken  (2.31). 
Así,  haciendo 

{xn+i  -  xn)2 

a  ~  xn  =  xn - — - . 

Xn+2  2xn-)_i  -|-  Xn 


se  tiene  que 

Xn  Xn+ i 

m  ~  q - 7 - r. 

Xn+ 2  *£n+l  \Xn+l  Xn) 

Teniendo  en  cuenta  que,  a  partir  de  la  expresión  del  proceso  iterativo  (2.26)  se  tiene  que 
Xn+1  ~  Xn  =  -qf{xn)/f'{xn)  y  xn+2  -  xn+1  =  -qf(xn+i)lf'{xn+ 1),  podemos  escribir 


m  ~  q 


-u(xn+ 1) 


u(xn+ 1)  -u{xny 


u(x) 


f(z) 

f'(x)' 


De  esta  forma,  a  partir  de  unas  aproximaciones  iniciales  xq  (de  la  raíz  a)  y  mo  (de  su 
multiplicidad)  tenemos  el  siguiente  proceso  iterativo: 


!mn+ 1 

•^n+1 


u(xn) 

mn  /  \  /  /  \  \ 5 

U(xn)  -  u(xn  -  mnu(xn)) 
Xn  ^nn-\-\u(xr^)  i 


u(x) 


fi x) 

f'(x)1 


n  >  0. 


(2.32) 


En  el  artículo  [147]  se  demuestra  que  la  sucesión  {xn}  definida  en  el  proceso  anterior 
tiene  convergencia  cuadrática  a  la  raíz  múltiple  a.  Además,  la  sucesión  {mn}  converge 
a  la  multiplicidad  de  a  como  raíz  de  (2.25).  Para  una  información  más  completa  sobre 
el  algoritmo  de  Van  de  Vel,  se  pueden  consultar  también  las  referencias  [81]  y  [148]. 


2.6.  Ejemplos  y  aplicaciones  del  método  de  Newton 

2.6.1.  Ejemplos  históricos 

Como  ya  se  puso  de  manifiesto  en  la  introducción  histórica  de  este  capítulo,  muchos 
historiadores  consideran  al  método  de  Herón  para  el  cálculo  de  raíces  cuadradas  como  el 
antecesor  del  método  de  Newton.  El  siguiente  ejemplo  analiza  este  problema  y  su  extensión 
al  cálculo  de  las  raíces  n-ésimas  de  un  número  real  positivo. 

Ejemplo  2.1.  El  conocido  como  método  de  Herón  es  un  algoritmo  que  sirve  para  aproximar 
la  raíz  cuadrada  de  un  número  positivo  a  >  0.  Aunque  fue  deducida  por  el  matemático  griego 
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Herón  de  Alejandría  en  el  siglo  Id.  C.,  también  se  puede  obtener  al  aplicar  el  método  de 
Newton  para  resolver  la  ecuación 

f{x)  =  x2  —  a,  a  >  0.  (2.33) 


En  efecto,  en  este  caso  la  función  de  iteración  es  Nf(x)  =  ( x 2  +  a)/(2x)  y  la 
sucesión  originada  por  el  método  de  Newton  es 

Es  sencillo  comprobar  que  dicha  sucesión  converge  a  y/a  para  cualquier  punto  de 
partida  xo  >  0  y  que  además  lo  hace  con  convergencia  cuadrática.  Ambos  hechos 
permiten  obtener  buenas  aproximaciones  de  y/a  con  unas  pocas  iteraciones. 


La  fórmula  de  fferón  se  puede  generalizar  al  cálculo  de  las  raíces  L-ésimas  de  un 
número  real  positivo  (véase  [58]),  aplicando  en  este  caso  al  método  de  Newton  a 
la  función  f{x)  =  xk  —  a  y  obteniendo  la  sucesión 


%n-\- 1 


(/.'  -  1  )xkn  +  a 

]/>  ry>  k —  1 


Desde  el  punto  de  vista  formal,  la  misma  fórmula  anterior  se  podría  aplicar  para 
el  cálculo  de  las  raíces  fc-ésimas  de  un  número  complejo  cualquiera. 


Tal  vez  la  ecuación  no  polinómica  más  conocida,  tanto  por  sus  aplicaciones  en  Astronomía, 
por  su  relevancia  histórica  como  por  su  interés  intrínseco  es  la  conocida  como  ecuación  de 
Kepler.  Fue  enunciada  por  el  astrónomo  alemán  Johannes  Keplcr  alrededor  del  año  1609  en 
su  libro  Astronomía  Nova,  donde  se  establecía  que  la  anomalía  x  de  una  órbita  elíptica  viene 
dada  por  la  ecuación 

f(x)  =  x  —  e  sen  x  —  M,  (2.34) 

siendo  M  la  anomalía  media  y  e  la  excentricidad  de  dicha  órbita  elíptica.  Desde  el  punto 
de  vista  de  las  interpretaciones  astronómicas,  tanto  x  como  M  son  ángulos  entre  0  y  27t 
radianes,  mientras  que  la  excentricidad  es  un  valor  comprendido  entre  0  y  1.  Además,  debido 
a  la  simetría  de  la  elipse  respecto  a  su  eje  mayor,  se  puede  reducir  el  estudio  a  anomalías 
medias  comprendidas  entre  0  y  ti. 

Existen  muchas  maneras  de  resolver  la  ecuación  de  Kepler  (el  texto  de  Colwell  [34]  da 
buena  muestra  de  ello).  En  este  nos  centraremos  en  su  resolución  mediante  métodos  iterativos, 
tal  y  como  se  hace  por  ejemplo  en  los  artículos  de  Charles  y  Tatum  [33],  Danby  [38],  [39]  o 
Palacios  [113]. 

Ejemplo  2.2.  Consideremos  el  método  de  Newton  para  aproximar  numéricamente  una  so¬ 
lución  de  la  ecuación  de  Kepler  (2.3j).  Notemos  que  dicha  ecuación  se  podría  generalizar, 
desde  el  punto  de  vista  formal,  a  una  ecuación  del  tipo 


f(x)  =  x  —  b  —  a  sen  x, 
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donde  a  y  b  son  dos  parámetros  reales  o  complejos  dependiendo  de  que  la  variable  x  sea  real 
o  compleja. 

La  aplicación  del  método  de  Newton  a  la  ecuación  de  Kepler  (2.34)  da  lugar  a  la 
siguiente  función  de  iteración: 

M  +  efsenx  +  xcosx) 

Nf{x)  = - - - . 

1  —  e  eos  x 

Un  aspecto  clave  a  la  hora  de  estudiar  la  convergencia  del  proceso  iterativo  xn+\  = 
Nf(xn)  a  una  solución  de  la  ecuación  de  Kepler  (2.34)  es  la  elección  del  punto 
de  partida.  No  se  garantiza  siempre  la  convergencia  del  método  de  Newton  a  una 
solución  de  la  ecuación  de  Kepler.  Por  ejemplo,  suele  ser  habitual  considerar  la 
anomalía  media  como  punto  de  partida  Xq  =  M  del  método  de  Newton  para 
resolver  la  ecuación  de  Kepler.  Pero  con  esta  elección,  existen  valores  de  e  y  de  M 
para  los  que  no  se  obtiene  convergencia,  tal  y  como  pone  de  manifiesto  Conway  [35] 
para  e  =  0.992,  M  =  0.137T.  Sin  embargo,  Charles  y  Tatum  [33],  proponen  tomar 
E0  =  7 r,  ya  que  justifican  que  para  ese  valor  se  puede  asegurar  la  convergencia  del 
método  de  Newton  a  una  solución  de  la  ecuación  de  Kepler  (2.34)  para  cualquier 
elección  de  M  e  [0, 7r]  y  e  G  (0, 1).  En  el  cuadro  2.1  se  muestra  el  comportamiento 
de  las  sucesiones  a  las  que  hacen  referencia  estos  dos  ejemplos. 

Cuadro  2.1:  Importancia  de  la  elección  del  punto  de  partida  en  el  comportamiento  del  método 
de  Newton  aplicado  a  la  ecuación  de  Kepler  (2.34),  con  e  =  0.992  y  M  =  0.137T. 


x0 

Xl 

X2 

x3 

x± 

x5 

¿Convergencia? 

M 

4.80602 

-1.12977 

-0.017804 

50.0667 

-1760.76 

No 
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1.76951 

1.44453 

1.38508 

1.38296 

1.38296 

Sí 

2.6.2.  Ejemplos  patológicos 

Sería  una  ingenuidad  pensar  que  el  método  de  Newton  nos  permite  aproximar  la  solución 
de  cualquier  ecuación  no  lineal  f(x)  =  0.  Como  hemos  visto  en  la  sección  2.4,  en  teoría,  se 
deben  comprobar  una  serie  de  condiciones  para  poder  garantizar  las  siguiente  cuestiones: 

1.  Que  la  sucesión  sea  convergente. 

2.  Que  el  límite  sea  la  raíz. 


3.  Que  la  convergencia  se  produzca  en  un  tiempo  «razonable». 
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Los  siguientes  ejemplos  tienen  como  objetivo  el  mostrar  que,  en  ocasiones,  la  sucesión 
generada  por  el  método  de  Newton  para  resolver  una  ecuación  no  lineal  f(x)  =  0,  no  siempre 
produce  los  resultados  deseables.  Los  tres  primeros  ejemplos  han  sido  tomados  de  [17]. 

Ejemplo  2.3.  Analícese  el  comportamiento  del  método  de  Newton  aplicado  a  la  función 
f  :  M  — M,  definida  por  f(x)  =  el~x  —  1. 

Obsérvese  que  la  función  anterior  tiene  una  única  raíz  simple  a  =  1,  pues  f'(x )  = 

— el  x  y  /'( 1)  =  —1.  Ahora,  bien  su  función  de  Newton  viene  dada  por 

Nf(x)  =x+l  --J-.  (2,35) 

Como  a  =  1  es  una  raíz  simple  de  /,  este  es  un  punto  fijo  superatractor  para  Nf. 

La  figura  2.13  muestra  las  gráficas  de  /  y  Nf. 


Figura  2.13:  Gráficos  de  f(x )  =  e1  x  —  1  y  de  su  correspondiente  función  de  iteración  para 
el  método  de  Newton,  Nf(x). 

Como  f(x)  es  decreciente  y  convexa  en  M,  el  teorema  de  Fourier  (teorema  2.5) 
garantiza  que  si  partimos  de  xq  <  1,  la  sucesión  xn+\  =  Nf(xn )  es  creciente 
y  converge  a  a.  Por  otra  parte,  si  partimos  de  a:o  >  1,  entonces  se  tiene  que 
X\  =  Nf(xo)  <  1  y  a  partir  de  aquí  se  inicia  la  convergencia  monótona  creciente 
hacia  la  raíz  a.  En  consecuencia  se  tiene,  en  este  caso,  que  la  cuenca  de  atracción 
de  del  único  cero  de  /  es  todo  M. 

No  obstante  ocurre  el  siguiente  fenómeno:  si  partimos  de  x0  que  es  grande  en 
valor  absoluto,  entonces,  x\  es  negativo  y  de  valor  absoluto  también  grande.  En 
consecuencia,  se  necesitarán  muchas  iteraciones  para  aproximar  a  la  raíz  a.  Para 
justificar  esta  afirmación,  notemos  que  Nf(x )  =  1  —  l/e1~x,  por  lo  tanto  si  x  es 
negativo  y  grande  en  valor  absoluto,  se  tiene  Nf(x)  ~  1,  en  otras  palabras,  el 
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gráfico  de  Nf  es  casi  paralelo  a  la  diagonal.  Entonces,  si  xn  <  —  1  y  es  grande 
en  valor  absoluto,  se  tiene  que  en  cada  iteración  el  valor  de  xn+\  =  N f(xn )  es 
aproximadamente  xn  +  1,  ya  que  xn+í  =  xn  + 1  —  l/(e1_:Eri)  y  el  valor  de  l/{el~Xn ) 
es  muy  pequeño.  Esto  puede  apreciarse  claramente  en  la  figura  2.14,  donde  se 
muestran  las  iteraciones  de  la  función  Nf(x),  a  partir  de  xq  =  4. 


Figura  2.14:  Iteraciones  de  Nf(x),  con  xq  =  4. 

Otra  forma  de  apreciar  la  convergencia  extremadamente  lenta  del  método  de 
Newton  en  este  caso  consiste  en  mostrar  algunas  iteraciones.  En  el  cuadro  2.2, 
hemos  elegido  xg  =  10.  Como  se  ve,  todavía  estamos  muy  lejos  de  a.  De  hecho,  se 
necesitan  muchas  más  iteraciones  para  aproximarse  a  la  solución  del  problema. 

Cuadro  2.2:  Primeras  iteraciones  del  método  de  Newton  aplicado  a  la  función  (2.35)  para  xg  =  10. 


x0 

10 

x5 

-8088.0839275753840076 

X\ 

-8092.0839275753840076 

x6 

-8087.0839275753840076 

-8091.0839275753840076 

X 7 

-8086.0839275753840076 

^3 

-8090.0839275753840076 

x8 

-8085.0839275753840076 

X4 

-8089.0839275753840076 

Xg 

-8084.0839275753840076 

En  resumen,  aunque  la  convergencia  en  este  caso  es  global,  es  decir,  cualesquie¬ 
ra  que  sea  el  punto  de  partida  elegido,  x0,  la  sucesión  de  los  iterados  de  Newton 
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xn+\  =  Nf(xn )  converge  a  a  cuando  n  — >  oo,  esta  convergencia  es  extremadamen¬ 
te  lenta  para  valores  que  no  están  próximos  a  la  solución.  Cabe  notar  aquí,  que  lo 
anterior  confirma  el  hecho  de  la  convergencia  cuadrática  del  método  de  Newton 
es  sólo  local,  cosa  que  evidentemente  ocurre  en  este  caso  cuando  estamos  cerca 
del  cero  a  =  1  de  nuestra  ecuación,  como  el  lector  puede  verificarlo  fácilmente. 


Ejemplo  2.4.  Analícese  el  comportamiento  del  método  de  Newton  aplicado  a  la  función 
f(x)  =  xe~x,  definida  en  toda  la  recta  real. 


Es  claro  que  la  única  solución  del  problema  f(x)  =  0  es  a  =  0.  Tenemos  f'{x)  = 
(1  —  x)e~x  y  c  =  1  es  el  único  punto  crítico  de  /  el  cual  es  un  máximo.  Por  lo 

tanto,  Nf  tiene  una  asíntota  vertical  en  c.  Estos  hechos  se  ven  reflejados  en  los 

x2 

gráficos  de  la  figura  2.15.  Ahora,  f"(x)  —  (x  —  2)e~x  y  Nf(x)  =  - -.  De  esto 

X  -L 

ya  podemos  obtener  las  siguientes  conclusiones: 


■  lím  Nf(x)  =  —  oo. 

x^l~ 

■  lím  Nf(x)  =  Too. 

x— >1+ 

■  lím  Nr(x )  =  — oo. 

x — > — oo  J 

■  lím  Nf(x)  =  Too. 

x — >+oo  J 


Como  el  cero  a  =  0  de  /  es  simple,  se  tiene  que  es  un  punto  fijo  superatractor. 
f  x(x  —  2) 

De  NUx )  =  — - - r^r,  vemos  que  x  =  2  es  un  punto  crítico  libre  de  Nf,  es  decir, 

1  ( x  —  1)-  ' 

un  punto  crítico  qne  no  es  raíz  de  la  ecuación  f[x)  =  0.  Dicho  punto  corresponde 
a  un  mínimo  en  el  intervalo  (1,  Too).  Notemos  que  si  Xq  >  1,  entonces  la  sucesión 
xn+ 1  =  Nf(xn )  es  creciente  y  tiende  a  Too  cuando  n  — >  Too.  Por  otra  parte,  la 
cuenca  de  atracción  de  a  =  0  es  el  intervalo  (— oo,  1).  En  este  caso,  tal  y  como  se 
precia  en  los  gráficos  de  la  figura  2.16,  ocurre  un  fenómeno  similar  al  del  ejemplo 
anterior,  con  una  convergencia  extremadamente  lenta  cuando  se  parte  de  valores 
negativos  que  son  grandes  en  valor  absoluto. 


Experimentalmente,  mostramos  en  el  cuadro  2.3  lo  dicho  arriba,  es  decir,  que  si  xq 
es  negativo  y  grande  en  valor  absoluto,  entonces  xn+\  ~  xn  T  1  y  la  convergencia 
se  produce  muy  lentamente. 


Ejemplo  2.5.  Analícese  el  comportamiento  del  método  de  Newton  aplicado  a  la  función 
f  :  M  — >  M,  definida  por  f(x)  =  x 1//3. 


En  este  caso,  /  no  es  derivablc  en  x  =  0  que  es  la  solución  de  la  ecuación  f(x)  =  0. 
Este  hecho  nos  producirá  un  efecto  no  deseado  en  el  método  de  Newton,  ya  qne 
para  x  0,  la  aplicación  de  Newton  viene  dada  por  Nf(x)  =  — 2x .  Evidentemente 
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Figura  2.15:  Gráficos  de  f(x)  =  xe  x  y  de  Nf(x). 


Figura  2.16:  Iteraciones  de  Nf(x),  con  xo  =  0.99. 

esta  aplicación  tiene  ai  =  0  como  punto  fijo,  pero  esta  vez  es  repulsor.  De  hecho, 
para  todo  x$  ^  0  se  tiene  que  xn+\  =  Nf(xn)  no  converge,  de  hecho  \Nf(xn)\  — >  oo 
cuando  n  — >  oo. 

Ejemplo  2.6.  Analícese  el  comportamiento  del  método  de  Newton  para  resolver  la  ecuación 
f(x)  =  e~x  —  senx  =  0. 

Notemos  que  esta  ecuación  tiene  infinitas  soluciones,  todas  ellas  positivas,  sien¬ 
do  la  menor  a_i  ~  0.588533.  Las  restantes  son  aproximadamente  iguales  a 
7r,  27r,  37 r, ....  Un  cálculo  directo  muestra  que  ellas  son  todas  simples.  La  figu- 
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Cuadro  2.3:  Primeras  iteraciones  del  método  de  Newton  aplicado  a  la  función  f(x)  =  xe 
para  xg  =  —20  en  las  que  se  aprecia  una  lenta  convergencia  hacia  la  solución  a  =  0. 


X0 

-20 

x5 

-15.263082764788051772 

X\ 

-19.047619047619047619 

x6 

-14.324571721984109704 

%2 

-18.097500282773441918 

x7 

-13.389826400427451386 

-17.149863156719935957 

- 12.459319942056994248 

X4 

-16.204959990859412805 

Xg 

-11.533617900966140257 

ra  2.17  muestra  la  gráfica  de  f(x)  y  de  su  correspondiente  función  de  iteración 
para  el  método  de  Newton,  Nf(x). 


Figura  2.17:  Gráfico  de  f(x)  =  e  x  —  sen(x)  y  de  Nf(x). 


El  comportamiento  dinámico  de  esta  función  es  complicado,  pues  tiene  infinitos 
puntos  fijos  superatractores,  infinitos  puntos  periódicos  de  período  2,  infinitos 
puntos  preperiódicos,  etc.  Las  iteraciones  de  la  función  Nf(x)  son  muy  sensibles 
a  la  elección  de  la  condición  inicial,  tal  y  como  se  muestra  en  la  figura  2.18,  donde 
se  ve  que  la  sucesión  xn+i  =  Nf(xn),  con  x0  =  11.15  se  aproxima  a  la  raíz  que 
está  cerca  de  7tt.  Además,  en  el  cuadro  2.4  se  observa  que  pequeños  cambios  en 
el  punto  de  partida  provoca  grandes  cambios  en  el  comportamiento  del  método 
de  Newton  y,  en  concreto,  la  convergencia  hacia  distintos  límites. 


Ejemplo  2.7.  En  este  ejemplo,  tomado  de  [67],  se  muestra  el  mal  comportamiento  del  método 
de  Newton  aplicado  a  un  función  que  es  continua  en  toda  la  recta  real  y  que  tiene  derivada 
continua  en  {0}.  En  concreto,  sea 


f(z)  = 


7r  —  2xsen(n/x)  si  x  ^  0, 
7 r  si  x  =  0. 


(2.36) 
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Figura  2.18:  Gráfico  de  algunas  iteraciones  de  Nf(x),  con  f(x)  =  e  x  —  sena;  y  xq  =  11.15. 


Cuadro  2.4:  Iteraciones  del  método  de  Newton  aplicado  a  la  función  f(x)  =  e~x  —  sena;,  con 
puntos  de  partida  xq  =  11.14,  xq  =  11.15,  xo  =  11.16  y  xq  =  11.17.  Se  observa  que  ligeros 
cambios  en  el  punto  de  partida  provoca  que  el  límite  a  de  la  iteración  sea  distinto  en  cada 
caso. 


x0 

11.14 

11.15 

11.16 

11.17 

Xi 

18.0152 

17.5735 

17.1864 

16.8445 

X2 

19.1183 

20.8670 

6.3865 

14.6885 

x3 

18.8429 

22.9548 

6.2847 

6.3146 

X4. 

18.8496 

21.5153 

6.28505 

15.6207 

x5 

18.8496 

22.0306 

6.28505 

15.7082 

x6 

18.8496 

21.9911 

6.28505 

15.7080 

a 

PS  67T 

~  7tt 

PS  27T 

57 r 

Entonces  la  sucesión  generada  por  el  método  de  Newton  aplicado  a  esta  función  y  empezando 
en  xo  =  1/2  converge  a  0,  pero  /(O)  ^  0. 

Notemos  que  en  este  caso,  el  método  de  Newton  da  lugar  a  la  sucesión 

1  7Txn  —  2x'lseií(n/xn ) 

2  ¿tt  cos{7r /xn)  —  2xnsen(7r /Xn) 

No  es  difícil  comprobar  que  xn  =  1/2"  para  n  >  0,  por  lo  que,  evidentemente, 
límn_>oo  xn  =  0  y,  sin  embargo  /(O)  =  tt,  por  lo  que  el  límite  de  la  sucesión 
generada  por  el  método  de  Newton  no  es  una  raíz  de  la  ecuación  asociada  (véase 
la  figura  2.19). 
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0.1 


0.2 


0.3 


0.4 


0.5 


0.6 


Figura  2.19:  El  método  de  Newton  aplicado  a  la  función  (2.36). 


por  lo  que  líni)WOO  f\xn)  =  oo. 

Con  este  ejemplo  se  muestra  que  aunque  el  método  de  Newton 


f'M 


dé  lugar  a  una  sucesión  convergente  a  un  cierto  límite  L  G  M,  no  se  puede  ga¬ 
rantizar  que  f(L )  =  0.  En  efecto,  si  lím^,*,  \f'(xn)\  =  oo,  como  ocurre  en  este 
ejemplo,  entonces  puede  ocurrir  que 


sin  que  lím^^  f(xn)  =  0. 

2.6.3.  Sistemas  de  ecuaciones  no  lineales 

La  extensión  natural  del  método  de  Newton  para  resolver  un  sistema  de  ecuaciones  no 
lineales  del  tipo  F(x)  =  0,  con  i6l"yf=(/i,...,  fn ),  es  decir  F  :  Mn  — >  Mn,  consiste  en 
construir  una  sucesión  de  vectores  mediante  el  siguiente  proceso  iterativo 


donde  x ^  =  (x[k\...,x^)  G  Mn  y  F'(x^)  es  la  matriz  jacobiana  de  F  formada  por  las 
derivadas  parciales, 
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En  la  práctica,  en  lugar  de  invertir  la  matriz  jacobiana  en  cada  paso,  suele  ser  más  reco¬ 
mendable  resolver  un  sistema  de  ecuaciones  lineales.  De  esta  forma,  la  expresión  alternativa 
del  método  de  Newton  se  puede  escribir  en  dos  etapas: 

^(fc+i)  _  x(k)  _| _y(*0.  ¿oncie  F\x^)y^  =  —F{x^). 

Los  siguientes  ejemplos  tienen  como  objetivo  ilustrar  este  procedimiento  en  situaciones 
sencillas,  si  entrar  a  analizar  en  detalle  cuándo  se  garantiza  que  la  correspondiente  sucesión 
vectorial  esté  bien  definida  y  sea  convergente  a  una  solución  del  sistema.  Para  profundizar 
en  estos  aspectos  se  pueden  consultar  las  siguientes  referencias:  [78],  [109],  [112],  [123]. 

Ejemplo  2.8.  El  sistema  de  ecuaciones  que  aparece  en  este  ejemplo  ha  sido  estudiado  tam¬ 
bién  en  [133].  Usando  el  método  de  Newton,  resuélvase  el  sistema  de  ecuaciones  no  lineales: 

Íx  —  sen  x  cosh  y  =  0  . 

y  (2.38) 

y  —  eos  x  senil  y  =  0, 

partiendo  de  (. xo,yo )  =  (14,5). 


El  sistema  anterior  se  puede  escribir  con  notación  vectorial  de  la  forma 


F(x,y)  =  ( fi{x,y)J2(x,y))T 


donde 

fi  (x,  y)  =  x  —  sen  x  cosh  y ,  (x,y)  =  y  —  eos  x  senh  y. 

La  matriz  asociada  al  operador  lineal  F'(x,y)  (matriz  jacobiana)  es: 


F\x,y) 


1  —  cos(a;)  cosh(r/)  —  sen(x)  senh(y) 
sen(x)  senh(r/)  1  —  cos(a;)  cosh  (y) 


Por  lo  tanto,  el  método  de  Newton  se  puede  escribir  de  la  forma 


|  *£fc+i 

y  Vk+i 


i 


siendo  (uf.,  v¡])T  la  solución  del  sistema  de  ecuaciones  lineales  F\xk,  yk)(uk,  Vk)T  = 
— F(xk,yk )  o  equivalentemente 


/  1  -  eos (xk)  cosh (yk)  -  sen (xk)  senh (yk)  \  í  uk 
y  sen(xfe)  senh (yk)  1  -  cos(xk)  cosh (yk)  )  y  vk 


Xk  —  sen  Xk  cosh  tjk 
yk  -  eos  xk  senh  yk 


En  el  cuadro  2.5  se  muestran  los  primeros  5  pasos  de  este  procedimiento  iterativo 
para  obtener  la  siguiente  solución  aproximada  del  sistema  (2.38): 


(x,y)  =  (13.9,3.35221). 
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Cuadro  2.5:  Primeros  pasos  del  método  de  Newton  para  resolver  el  sistema  (2.38). 


k 

xk 

IJk 

0 

14 

5 

1 

13.9697 

4.19414 

2 

13.9318 

3.62644 

3 

13.9059 

3.38694 

4 

13.9001 

3.35281 

5 

13.9000 

3.35221 

Ejemplo  2.9.  El  siguiente  ejemplo  aparece  en  [50].  Se  trata  de  encontrar,  usando  el  mé¬ 
todo  de  Newton,  una  solución  del  sistema  de  tres  ecuaciones  no  lineales  con  tres  incógnitas 
siguiente 

!3x  —  eos  (yz)  —  0.5  =  0, 

x2  —  81  (y  +  0.1)2  +  sen(^)  +  1.06  =  0,  (2.39) 

20  2  +  e~xy  +  9.472  =  0, 

partiendo  de  (xo,yo,zo)  =  (0.1,  0.1, —0.1). 

La  matriz  jacobiana  es  en  este  caso: 

/  3  2  sen(7/z)  ysen(yz)  \ 

2x  — 162(2/  +  0.1)  cos(^) 
v  -e~xyy  -e~xyx  20  ) 

La  sucesión  vectorial  obtenida  por  el  método  de  Newton  se  muestra  en  el  cua¬ 
dro  2.6.  En  la  misma  se  observa  la  convergencia  hacia  la  solución  solución: 

(x,y,z)  =  (0.5,0,-0.5236). 


Cuadro  2.6:  Primeros  pasos  del  método  de  Newton  para  resolver  el  sistema  (2.39). 


k 

xk 

Vk 

Zk 

0 

0.1 

0.1 

-0.1 

1 

0.49987 

0.0194668 

-0.523558 

2 

0.500014 

0.00158853 

-0.5236 

3 

0.5 

0.00001238 

-0.5236 

4 

0.5 

0 

-0.5236 
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Los  sistemas  de  ecuaciones  no  lineales  pueden  verse  como  un  caso  particular  de  una  ecua¬ 
ción  matricial  F(X)  =0  siendo  X  y  0  unas  matrices  de  dimensiones  adecuadas.  El  siguiente 
ejemplo  muestra  una  de  estas  ecuaciones,  conocida  como  ecuación  de  Riccati  algebraica.  Un 
estudio  más  detallado  de  este  tipo  de  ecuaciones  y  de  sus  numerosas  aplicaciones  puede 
encontrarse  en  el  manual  de  Lancaster  y  Rodman  [88]. 

Ejemplo  2.10.  La  ecuación  de  Riccati  algebraica  es  un  ecuación  del  tipo 

R(X)  =  XDX  -  XA  -  AtX  -C  =  0,  (2.40) 

donde  D,  A,  C  G  Mnxn  son  matrices  dadas,  AT  denota  la  matriz  traspuesta  de  A  y  X  e  Mnxn 
es  una  matriz  incógnita.  Supondremos  que  D  es  una  matriz  simétrica. 

Para  poder  aplicar  la  teoría  de  Newton-Kantorovich  a  la  ecuación  de  Riccati, 
notemos  en  primer  lugar  que  el  operador  R(X)  resulta  ser  cuadrático,  es  decir, 
R"(X)  es  un  operador  bilineal  constante.  Las  expresiones  de  sus  derivadas  de 
Fréchet  de  primer  y  segundo  orden  son 

R'(X)Y  =  (XD  -  At)Y  +  Y(DX  -  A),  R"(X)YZ  =  YDZ  +  ZDY. 

Para  una  norma  matricial  ||  ■  ||  dada  se  tiene  que 

\\R!\X)YZ\\<2\\D\\\\Y\\\\Zl 

luego  ||R"(X)||  <  2||£>||. 

Tomamos  como  punto  de  partida  una  matriz  simétrica  X0.  Entonces  para  hallar 
el  inverso  de  R'(X 0),  debemos  resolver  una  ecuación  de  Liapunov  de  la  forma 

R\X0)Y  =  (DX0  -  A)tY  +  Y(DX0  -  A)  =  Z  <=>  R\X0)~lZ  =  Y. 

Se  sabe  (véase  [88])  que  esta  ecuación  tiene  solución  si  DX0  —  A  es  estable,  es 
decir,  todos  sus  valores  propios  tienen  parte  real  negativa.  En  este  caso,  la  solución 
es 

roo 

Y  =  -  exp ((DX0  -  A)Tt)Z  exp((LLY0  -  A)t)  dt 

Jo 

y  la  iteración  correspondiente  al  método  de  Newton  queda,  en  este  caso,  de  la 
forma 

roo 

xn+1  =  Xn  -  /  exp {{DXn  -  A)Tt)Z  exp((DXn  -  A)t)  dt. 

Jo 

Como  consecuencia  del  teorema  de  Kantorovich  (teorema  2.4)  se  obtiene  un  resul¬ 
tado  de  convergencia  para  la  ecuación  de  Riccati.  Si  X0  es  una  matriz  simétrica 
tal  que  DX0  —  A  es  estable  y 


/  r°°  \  ^  I 

2||D||||i?(J>f„)||  ^  ||exp((DX„-2l)Tí)||||exp((M„-/l)í)||díJ  < 
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entonces  el  método  de  Newton  converge  a  una  solución  de  la  ecuación  de  Riccati 
algebraica. 

Consideramos  la  ecuación  de  Riccati  (2.40)  para  las  matrices 


D  = 


Tomamos  como  punto  de  partida  la  matriz 


X0  = 


Entonces,  las  cuatro  primeras  matrices  obtenidas  aplicando  el  método  de  Newton 


a  (2.40)  son 


Xi  = 


1/2  1  \ 

1  3/2  )  3 


X2 


1/4  5/6  \ 
5/6  2/3  ) 


_  í  1/8  53/60  \  X  —  f  V16  1013/1080  \ 

'  ¡  ^  53/60  11/18  )  ’  "  4  _  \  1013/1080  4549/8100  )  ' 

Se  observa  que  el  método  converge  a  la  solución  exacta  de  la  correspondiente 
ecuación  que  es,  en  este  caso: 


X*  = 


2.6.4.  Ecuaciones  y  sistemas  con  raíces  múltiples 

Cuando  se  trata  de  aproximar  una  raíz  múltiple,  el  método  de  Newton  tiene  un  com¬ 
portamiento  diferente  al  caso  general.  De  entrada,  se  pierde  la  velocidad  de  convergencia 
cuadrática,  pasando  únicamente  a  convergencia  lineal.  En  el  caso  escalar,  la  multiplicidad  de 
una  raíz  a  se  presenta  cuando  f(a )  =  /'(a)  =  0.  En  el  caso  de  sistemas  de  ecuaciones  lo 
que  ocurre  es  que  la  matriz  jacobiana  F\x)  no  tiene  inversa  en  la  solución  del  sistema.  En 
este  apartado  mostramos  algunos  ejemplos  que  usan  variantes  del  método  de  Newton  para 
ecuaciones  con  raíces  múltiples.  Un  análisis  en  mayor  profundidad  de  este  tipo  de  problemas 
se  puede  ver  en  [86],  [81],  [122],  [147]  o  [148]. 

Ejemplo  2.11.  Para  ilustrar  el  comportamiento  del  método  de  Van  de  Vel  (2.32)  se  considera 
el  conjunto  de  funciones  test  que  aparece  en  [147]: 


f(x)  =  ex(x2  —  l)m,  m  —  1, 5,  9,  7/5, 7r. 
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Tomamos  como  puntos  de  partida  m o  =  0.99  y  xq  =  1.5  para  obtener  los  datos 
que  se  muestran  en  el  cuadro  2.7.  En  el  ejemplo  se  aprecia  que  ambas  sucesiones 
{xn}  y  {mn}  tienen  una  rápida  convergencia  hacia  la  raíz  múltiple  a  =  1  y 
su  multiplicidad  m.  Se  ha  seguido  la  estrategia  de  tomar  como  multiplicidad 
inicial  un  valor  próximo  a  1,  lo  cual  puede  ser  razonable  si  no  se  tiene  ningún 
conocimiento  a  priori  de  la  multiplicidad  de  la  raíz.  Ahora  bien,  la  convergencia 
de  este  tipo  de  procesos  está  fuertemente  condicionada  por  tener  que  partir  de 
un  punto  Xq  lo  suficientemente  próximo  a  la  solución  buscada.  En  otro  caso,  los 
resultados  pueden  no  ser  los  esperados. 


Cuadro  2.7:  El  método  de  Van  de  Vel  (2.32)  aplicado  a  las  funciones  f(x )  =  ex(x2  —  l)m  con 
m  =  1,5, 9,  7/5, 7 r. 


m  = 

1 

i 

mi 

Xi 

1 

2.17460 

0.86041 

2 

1.07446 

1.05138 

3 

1.07658 

0.99999 

4 

0.99999 

1 

m  = 

5 

i 

mi 

Xi 

1 

7.91095 

0.89146 

2 

4.85949 

1.00601 

3 

5.02166 

0.99999 

4 

5 

1 

m  = 

9 

i 

rrii 

Xi 

1 

13.4711 

0.90393 

2 

8.75016 

1.00341 

3 

9.01932 

1 

4 

9 

1 

m  —  7/5 

i 

Xi 

1 

2.79954 

0.857903 

2 

1.43462 

1.03504 

3 

1.46018 

0.99997 

4 

1.39996 

1 

m  = 

71 

i 

mi 

Xi 

1 

5.30876 

0.87835 

2 

3.06698 

1.01082 

3 

3.17022 

0.99999 

4 

3.14158 

1 

Ejemplo  2.12.  En  este  ejemplo,  tomado  de  [122],  se  analiza  el  comportamiento  del  método 
de  Newton  para  resolver  el  sistema  de  ecuaciones 


x2  —  xy  +  y2  +  x  =  2, 
3a;2  +  2  xy  +  2  y  =7. 


(2.41) 


Un  análisis  gráfico  nos  permite  situar  las  soluciones  del  sistema.  Como  se  ve  en 
la  figura  2.20  el  sistema  tiene  3  soluciones.  En  dos  de  ellas  la  matriz  jacobiana 
es  inversible  y,  por  tanto,  el  método  de  Newton  tiene  convergencia  cuadrática. 
Sin  embargo  la  tercera  solución  está  sobre  la  curva  de  puntos  donde  se  anula  la 
matriz  jacobiana,  marcada  con  un  trazo  verde  discontinuo  en  la  figura  2.20.  Se 
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Figura  2.20:  Gráfica  de  las  curvas  x2  —  xy  +  y2  +  x  =  2  (en  rojo)  y  3x2  +  2 xy  +  2y  =  7  (en 
azul),  así  como  de  la  curva  10x2  —  12 xy  +  6x  —  4 y2  —  2y  +  2  =  0  (en  verde)  formada  por  los 
puntos  (x,  y)  donde  det (F'(x,y))  =  0. 


trata  por  tanto  de  una  solución  singular  y  el  método  de  Newton  tiene  un  orden 
de  convergencia  lineal. 

En  este  caso,  la  matriz  jacobiana  es 


F\x,y) 


2x  —  y  +  1  2  y  —  x 
6x  +  2  y  2x  +  2 


y  su  determinante  det(F'(x,  y))  =  10x2  —  12 xy  +  6x  —  4 y2  —  2y  +  2. 

Como  vemos  en  el  cuadro  2.8,  el  método  de  Newton  necesita  4  iteraciones  para 
alcanzar  cada  una  de  las  raíces  simples  (trabajando  con  seis  dígitos  de  precisión) 
mientras  que  para  aproximar  la  raíz  múltiple  se  necesitan  21  iteraciones. 


Cuadro  2.8:  El  método  de  Newton  para  encontrar  las  tres  soluciones  del  sistema  (2.41). 


Ia  raíz  simple 

2a  raíz  simple 

Raíz  múltiple 

i 

Xj 

Vi 

i 

Xi 

Vi 

i 

Xi 

Vi 

0 

-2 

2 

0 

-2 

-3 

0 

0 

0 

1 

-1.62069 

0.982759 

1 

-1.47222 

-2.25000 

5 

0.96367 

1.07267 

2 

-1.59799 

0.566914 

2 

-1.36138 

-2.09177 

10 

0.99886 

1.00227 

3 

-1.59149 

0.506533 

3 

-1.35601 

-2.08406 

15 

0.99996 

1.00007 

4 

-1.59137 

0.505093 

4 

-1.35600 

-2.08404 

20 

0.99999 

1.00000 
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Ejemplo  2.13.  En  [86]  se  presenta  una  extensión  del  método  de  Newton  para  raíces  múltiples 
para  el  caso  de  sistemas  de  ecuaciones  no  lineales.  La  utilizamos  para  resolver  el  sistema  de 
ecuaciones 


re  sen  x  +  y3  =  0, 
y  +  x  sen  y  =  0. 


(2.42) 


El  sistema  (2.42)  tiene  en  (x,  y)  =  (0,  0)  una  ecuación  singular.  En  efecto,  en  este 
caso,  si  F(x,  y)  =  (x  sen  x  +  y3,  y  +  x  sen  y)  se  tiene  que 


F'(x,y)  = 


x  cos(a;)  +  sen(x)  3 y2 

sen  (y)  xcos(|/)  +  l 


F(0,0)  = 


y  det(F'(0,0))  =  0. 

Si  denotamos  fi(x,y)  =  x  sen  x  +  y3  y  f2(x,  y)  =  y  +  x  sen  y,  podemos  escribir 


fi(x,y)  =  x2  +  J2  caxaiya2,  f2{x,y)  =  y  +  Y,  daxaiya 2 

M>3  H>3 

donde  a  es  un  niulti- índice,  a  =  (ai,a2)  €  N2,  |a|  =  ol\  +  a2.  El  menor  grado  de 
los  términos  homogéneos  que  aparecen  en  los  desarrollos  anteriores  se  denomina 
orden  de  (x,y)  =  (0,0)  como  cero  de  j) ,  j  —  1,2  y  se  denota  por  kj.  En  nuestro 
caso,  se  tiene  que  k\  —  2,  k2  —  1. 

Para  este  problema,  (2.42),  el  método  de  Newton  (2.37)  presenta  un  orden  de 
convergencia  lineal  para  aproximar  dicha  raíz.  Sin  embargo,  la  modificación  in¬ 
troducida  por  Kravanja  y  Haegemans  en  [86],  dada  por 

X(k+i)  =  x{k)  _  p^xW)-1  diag(lfei, . . . ,  kn)F(X^),  X(k)  =  (x{k\  y{k)),  (2.43) 


recupera  el  orden  de  convergencia  cuadrático,  tal  y  como  se  pone  de  manifiesto 
en  el  cuadro  2.9.  El  método  modificado  de  Kravanja-Haegemans  converge  en  5 
iteraciones,  mientras  que  el  método  de  Newton  clásico  necesita  18  iteraciones  para 
llegar  a  la  solución  con  la  misma  precisión. 


2.6.5.  Ecuaciones  funcionales 

El  método  de  Newton,  en  su  versión  más  general  que  hemos  denominado  método  de 
Newton-Kantorovich,  permite  su  aplicación  a  ecuaciones  definidas  entre  espacios  de  funciones, 
como  puede  ser  el  caso  de  ecuaciones  diferenciales  o  ecuaciones  integrales.  Mostramos  a 
continuación  algunos  ejemplos. 
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Cuadro  2.9:  El  método  de  Newton  (2.37)  y  la  modificación  de  Kravanja-Haegemans  (2.43) 
para  el  sistema  (2.42). 


i 

Newton  (2.37) 

Kravanja-Haegemans  (2.43) 

0 

(0.75,0.75) 

(0.75,0.75) 

1 

(1.65444,  -0.462403) 

(-0.258806,0.379649) 

2 

(-0.25613,-0.322061) 

(-0.146683,-0.048575) 

3 

(0.095719,0.143380) 

(0.001126,0.008402) 

4 

(0.077952,0.002233) 

(0.000262,0.000007) 

4 

(0.038937,0.000080) 

(0,0) 

Ejemplo  2.14.  La  ecuación  de  Chandrasekhar  [32]  es  una  ecuación  que  aparece  en  diversos 
problemas  físicos  ( transferencia  radiactiva,  cinética  de  gases,  etc.).  Consideramos  el  espacio 
X  =  C[0, 1]  formado  por  las  funciones  continuas  en  [0, 1]  y  dotado  de  la  norma  del  máximo 


|x||  =  máx  |x(í)|,  x  G  X. 
1  "  te  [o,i] 


Se  trata  de  encontrar  una  función  x  €  X  que  cumpla 

x(s)  =  1  +  A x(s)  [  - x(t)  dt,  s  G  [0, 1]. 

Jo  s  +  t 


(2.44) 


Con  notación  de  operadores,  el  problema  puede  plantearse  como  el  de  resolver  la  ecuación 


F(x)  =  0 

siendo  F  el  operador  definido  de  X  en  X  tal  que 

F(x)(s)  —  x(s)  —  1  —  Xx(s)  í  — S — x(t)  dt, 

Jo  s  + 1 

Estudiaremos  el  caso  particular  A  =  1/4. 


s  £  [0;  !]• 


En  primer  lugar,  como  aplicación  del  teorema  de  Kantorovich,  probaremos  la  exis¬ 
tencia  y  unicidad  de  solución  de  esta  ecuación.  Posteriormente,  encontraremos  una 
aproximación  numérica  de  la  misma.  Para  ello,  pasaremos  de  un  problema  conti¬ 
nuo  a  un  problema  discreto  utilizando  una  fórmula  de  integración  numérica  (de 
tipo  Gauss-Legendre)  para  aproximar  la  integral  que  aparece  en  (2.44).  Obtene¬ 
mos  así  un  sistema  de  ecuaciones  (no  lineal)  que  resolvemos  por  el  método  de 
Newton.  Las  incógnitas  son  los  valores  aproximados  de  la  solución  en  una  serie 
de  puntos  del  intervalo  [0, 1].  Finalmente,  a  partir  de  estos  valores  y  mediante  un 
proceso  de  interpolación  se  obtiene  la  aproximación  buscada. 
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Para  aplicar  el  teorema  de  Kantorovich,  necesitamos  partir  de  una  función  inicial 
adecuada.  Como  de  (2.44)  se  deduce  que  x(0)  =  1,  una  elección  razonable  parece 
ser  x0(<s)  =  1,  para  todo  s  G  [0, 1].  Además,  hay  que  calcular  el  operador  derivado 
F' .  Para  ello,  hay  que  tener  en  cuenta  que  F'  actúa  de  X  en  C{X),  el  espacio  de 
las  aplicaciones  lineales  de  X  en  X.  Así,  para  cada  x  G  X ,  F'(x)  G  £(X);  además 
F'{x)y  es  una  función  continua  para  cada  x,  y  G  X  definida  de  la  siguiente  manera: 


F'{x)y(s) 


F(x  +  hy)(s)  —  F(x)(s) 
/i->  o  h 


=  v(s)  ~\x(s)  Jo  j^í/(í)  dt  -  ^y(s)  jQ  j^x^dt,  s  G  [0, 1]. 

Podemos  considerar  el  subconjunto  Í2  que  aparece  en  el  enunciado  del  teorema 
de  Kantorovich  como  el  propio  conjunto  X  que,  por  supuesto,  es  un  conjunto 
convexo.  A  continuación,  calculamos  las  constantes  f3  y  7. 


En  primer  lugar, 


roF(i„)||<||r„||||F(i„)||; 


como 


«•>=-!  i 


1  /■'  s  u  s  1  +  s 

—  ai  =  —  -  iog - , 

o  s  + 1  4  s 


tenemos  que 


11^0)11  = 


log  2 


El  lema  de  Banach  sobre  inversión  de  operadores  nos  permite  encontrar  una  cota 
para  To  =  F'(x o)-1.  Dada  una  función  cualquiera  y  G  X,  se  tiene  que 

||  [J  -  F'{x0)}y\\  =  máx  \y(s)  -  F'(x0)y(s) \ 
se  [0,1] 


=  -  max 
4  se  [0,1] 


lo  s  +  t 


luego 


y{t)  dt  +  y(s) 


log  2 


'o  s  +  t 


dt 


<r  log2ll  II 


\\I-F\x0)\\  <  -j-  =  0.3465...  <  1, 

con  lo  que  se  garantiza  que  existe  To  =  F'(a;o)_1  y  además 

1  1 


ir0  < 


< 


1  -  ||J- F'(a;o)||  1- (log 2/2) 


=  1.5303... 


En  consecuencia, 


r0FW||  <  ,  (1A2/L  =  0-2651  ...  =  p. 


1- (log  2/2) 

De  forma  muy  parecida,  podemos  deducir  que 

iminn  -  F'(y)} II  <  ||r0||||F'(i)  -  F(y)\\  <  t  ^^2/2)  ^  “  *'11' 


2. 6.  Ejemplos  y  aplicaciones  del  método  de  Newton 


91 


Por  tanto, 


(l°g  2/ 4) 

7  = 


=  2/7 


1  -  (log  2/2) 

Así,  tenemos  qne  a  =  /7y  =  2 f32  =  0.1406...  <  1/2,  con  lo  que  se  cumplen 
las  condiciones  del  teorema  de  Kantorovich  y  se  prueba  la  existencia  de  solución 
de  (2.44).  Aún  podemos  precisar  más,  estableciendo  las  regiones  de  existencia  y 
unicidad.  Para  ello,  sean 

VI  -  2a  1  +  Wl  -  2a 

v  r\  007 n  j-**  v 


r  = 


7 


=  0.2870  . . . ,  t**  = 


=  3.4837... 


7 


Sabemos  que  la  ecuación  de  Chandrasekhar  tiene  una  solución  x*  localizada  en 
la  bola 


IV*  —  ¿no  II  <  t*  (V*(s)  ~~  1|  <  t*,  para  todo  s  G  [0, 1]) . 

Además  esta  solución  es  única  en  la  bola  ||x*  —  xo||  <  t**. 

Pasemos  ahora  a  encontrar  la  aproximación  numérica  de  la  solución  de  (2.44). 
Utilizando  la  fórmula  de  Gauss-Legendre,  podemos  hacer 

rl  1  rn 

/  f(t)dt&  -Y'Pjfitj), 

jo  z  j=l 

donde  tj  y  ¡3j  son  nodos  y  pesos  conocidos  (aparecen  tabulados  para  distintos 
valores  de  m).  En  particular,  para  m  —  8  son  los  que  aparecen  en  el  cuadro  2.10. 

Cuadro  2.10:  Pesos  (tj)  y  nodos  (/3j)  para  la  fórmula  de  Gauss-Legendre  para  m  =  8. 


V 

Pj 

J 

tj 

Pj 

i 

0.01985507 

0.10122854 

5 

0.59171732 

0.36268378 

2 

0.10166676 

0.22381034 

6 

0.762766205 

0.31370665 

3 

0.237233795 

0.31370665 

7 

0.89833324 

0.22381034 

4 

0.40828268 

0.36268378 

8 

0.98014493 

0.10122854 

Denotando  aq  a  las  aproximaciones  de  x(í¿),  i  =  1,...,8,  llegamos  al  siguiente 
sistema  de  ecuaciones  (no  lineal): 

1  8  x  ■ 

Xi  —  l-\ — xdi  y  Bj — - — ,  i  —  1, . . . ,  8. 

8  ¿í  Jt¿  +  V 

Si  hacemos  a%]  =  ti/3j/(8(ti  +  tj)),  podemos  escribir  el  sistema  anterior  en  la  forma 

8 

Xí  1  X  í  '  (lij  Xj , 

3= 1 


i  =  !,•••, 


(2.45) 
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Figura  2.21:  Gráfica  de  la  solución  aproximada  de  la  ecuación  de  Chandrasekhar. 

En  forma  matricial,  si  denotamos  x  =  (aq, . . . ,  x$)T  y  1  =  (1, ,  1)T, 

x  =  1  +  x  0  (Ax), 

donde  0  representa  el  producto  componente  a  componente.  La  solución  de  este 
sistema  es  el  siguiente  vector: 

(xi, . . . ,  x8)  =  (1.02176, 1.07334, 1.12599, 1.17011, 1.20351, 1.22698, 1.24205, 1.24999). 


Interpolando  la  función  que  pasa  por  los  puntos  ( í¿,x¿ )  i  =  1, ...  ,8,  y  sabiendo 
además,  que  x(0)  =  1,  obtenemos  la  gráfica  aproximada  de  la  solución,  que  se 
muestra  en  la  figura  2.21. 


Otra  fuente  importante  de  ejemplos  donde  aplicar  el  método  de  Newton  son  las  ecuaciones 
diferenciales.  En  este  contexto,  consideramos  un  problema  de  valores  en  la  frontera  (PVF) 
del  tipo. 


d2y 

dx2 


+  9  (y)  =  0,  y{a)  =  A,  y(b)  =  B, 


(2.46) 


donde  y  —  y(x)  es  una  función  real  de  variable  real  lo  suficientemente  derivable  en  el  intervalo 
[a,b]. 

Lino  de  los  métodos  más  empleados  para  resolver  el  problema  (2.46)  es  el  que  se  conoce 
como  método  de  disparo.  Sin  entrar  en  muchos  detalles  (véase  [50]  o  [79]  para  más  informa¬ 
ción)  el  método  consiste  en  conjeturar  una  pendiente  inicial  a\  como  aproximación  de  y' (a). 
A  continuación,  se  resuelve  el  problema  de  valor  inicial  (PVI)  siguiente: 


d2y 
dx 2 


+  g(y)  =  o, 


y(a)  =  A, 


y  (a)  =  ai. 
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Sea  y(x,ai )  la  solución  del  problema  anterior.  Entonces,  si  \y(x,ai)  —  B\  es  menor  que  la 
precisión  deseada,  entonces  el  proceso  termina  y  y(x,  ai)  es  la  solución  del  PVF  (2.46).  Pero 
lo  más  normal  es  no  acertar  a  la  primera  con  la  aproximación  de  y' (a).  Por  ello,  se  puede 
buscar  otra  aproximación  a2  para  y'(a )  y  calcular  la  solución  y(x,  a2)  del  correspondiente 
PVI.  Si  \y(x,a2)  —  B\  signe  siendo  mayor  que  la  precisión  deseada,  se  pueden  usar  diversos 
métodos  iterativos  (bisección,  secante,  Newton)  para,  a  partir  de  a±  y  a2,  calcular  nuevas 
aproximaciones  «3,  aq, . . .  de  y' (a).  De  esta  forma,  hay  que  resolver  un  PVI  en  cada  paso. 

Existen  otras  técnicas  para  resolver  este  tipo  de  problemas,  como  las  basadas  en  el  cálculo 
de  variaciones.  En  el  siguiente  ejemplo,  mostramos  otra  alternativa,  propuesta  por  D.  A. 
Sánchez  [131]. 

Ejemplo  2.15.  El  método  de  Newton  se  puede  usar  en  una  alternativa  al  método  de  disparo 
para  resolver  el  PVF  (2.j6). 


La  clave  de  esta  alternativa  está  en  observar  qne  un  PVI 

dpy 

~¿¿2+d{y)=  0,  y{a)  =  Ay  y\a)  =  a 
satisface  la  ecuación  de  la  energía 

\(f)  +  G(y)  =  +  G(A),  G\y)  —  y(y).  (2.47) 

En  efecto,  derivando  en  (2.47), 

y'y"  +  G'(y)y'  =  0^  y" +  g(y)  =  0. 


Además,  sustituyendo  x  —  a  en  (2.47),  se  tiene  y'(a )  =  a. 

Observemos  ahora  que,  por  el  teorema  de  la  función  inversa,  (2.47)  puede  escri¬ 
birse 

/ dx\ 2  1 

\dy)  =  a2  +  2G{A)  -  2G{y) ' 

Entonces,  si  A  ^  B,  podemos  encontrar  la  solución  de  esta  ecuación: 


El  signo  +  se  considera  si  B  >  A  y  el  —  cuando  B  <  A.  A  partir  de  ahora 
supondremos  que  B  >  A.  El  otro  caso  se  estudia  de  forma  parecida.  La  cantidad 
xa  se  puede  entender  como  el  «tiempo»  que  emplea  la  solución  para  viajar  del 
punto  (A,  a)  a  la  recta  vertical  y  =  B  en  el  plano  ( y ,  y'). 
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Después  de  estas  consideraciones,  el  valor  a*  de  la  pendiente  que  nos  da  la  solución 
del  PVF  (2.46)  es  la  solución  de  la  ecuación  no  lineal  xa  =  b  —  a,  o  equivalente¬ 
mente, 

Fía)  —  b  —  a  —  í  ,  dy  =  0.  (2.48) 

+  2 G{A)  -  2 G{y) 

La  existencia  de  una  solución  a*  de  la  ecuación  (2.48)  depende  de  la  convergencia 
de  la  integral  y,  por  tanto,  de  la  función  G.  Bajo  condiciones  adecuadas,  por 
ejemplo  cuando  G  es  una  función  monótonamente  creciente  o  decreciente  [131], 
se  puede  probar  que  la  sucesión  generada  por  el  método  de  Newton: 

F(a„)  b-a -  íjffij  +  2  G(A)  -  2G(y))-1/2  dy 

“”+1  F'(a„)  anS%(al  +  2G(A)-2G(y))-^dy 

converge  a  a*. 

En  la  práctica  se  puede  tomar  como  punto  de  partida  de  esta  iteración  el  valor 
ai  —  (B  —  A)/ {b  —  a). 


Capítulo  3 

Dinámica  del  método  de  Newton  en  la 
recta  real 


3.1.  Introducción 


En  el  capítulo  1  ya  se  puso  de  manifiesto  que  el  comportamiento  dinámico  de  algunas 
funciones,  aparentemente  sencillas,  como  los  polinomios  de  segundo  grado  o  la  función  logís¬ 
tica,  puede  ser  extremadamente  complicado.  En  esta  sección  nos  vamos  a  centrar  en  estudiar 
el  comportamiento  dinámico  del  método  de  Newton,  introducido  en  el  capítulo  2,  cuando  se 
aplica  para  resolver  una  ecuación 

f(x)  =  0,  (3.1) 

siendo  /  una  función  real  de  variable  real.  Dejamos  para  el  capítulo  4  el  análisis  para  funciones 
de  variable  compleja. 

Así,  sea  /  :  M  — >  M  la  función  definida  en  la  ecuación  (3.1).  La  función  de  iteración  para 
el  método  de  Newton  es  entonces 

N^)  =  x-Wy  (3-2) 

Nuestro  objetivo  es  el  estudio  del  comportamiento  de  las  sucesiones  {a:n},  donde 

Xn+1  =  xn-  =  Nf(xn)  =  N?(x0),  n  >  0,  (3.3) 

J  \xn) 

para  distintos  puntos  de  partida  x0  G  M. 

Lina  rápida  inspección  a  la  función  de  iteración  del  método  de  Newton  nos  permite  sacar 
las  siguientes  conclusiones: 


1)  Si  a  es  una  raíz  simple  de  la  ecuación  (3.1),  es  decir,  satisface  f(a)  ^  0,  entonces  a  es 
un  punto  fijo  de  Nf,  es  decir,  Nf(a)  =  a.  Además,  como 


N'(a) 


mna) 

/'(a)2 
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se  trata  de  un  punto  fijo  superatractor  de  la  aplicación  Nf.  Notemos  que  este  aspecto 
implica  la  convergencia  cuadrática  del  método  de  Newton  si  comenzamos  con  un  punto 
inicial  cerca  de  la  raíz  buscada,  tal  y  como  se  puso  de  manifiesto  en  la  sección  2.4. 


2)  Cuando  a  es  una  raíz  múltiple  de  la  ecuación  (3.1),  entonces  a  también  es  un  punto 
fijo  de  Nf,  aunque  en  este  caso  se  trata  de  un  punto  fijo  atractor  con 


m  —  1 

- <  1, 

m 


siendo  m  la  multiplicidad  de  oí  como  raíz  de  /.  Como  vimos  en  la  sección  2.5,  la 
convergencia  del  método  de  Newton  en  estas  condiciones  es  solamente  lineal. 


Un  análisis  un  poco  más  profundo  nos  permite  afirmar  que,  dada  una  ecuación  (3.1),  el 
comportamiento  dinámico  de  la  función  de  iteración  del  método  de  Newton  (3.2)  nos  permite 
clasificar  a  los  puntos  de  la  recta  real  en  dos  conjuntos: 


£>(/)  =  {xq  G  R.  :  lím^  Nf(xo)  =  a  con  f(a)  =  0},  (3.4) 

M(f)  =  M  —  £>(/).  (3.5) 

Coloquialmente  hablando,  podríamos  definir  a  estos  conjuntos  como  los  puntos  «buenos»  y 
«malos»  para  el  método  de  Newton  con  el  siguiente  sentido:  B(f)  recoge  a  los  puntos  ini¬ 
ciales  xo  a  partir  de  los  cuales  el  método  de  Newton  (3.2)  converge  a  una  solución  de  la 
ecuación  (3.1).  Por  tanto,  en  M.(f)  se  incluyen  los  puntos  de  partida  para  los  cuales,  por  un 
motivo  u  otro,  el  método  de  Newton  no  converge  a  ninguna  solución  de  la  ecuación  conside¬ 
rada.  Obsérvese  qne  entre  los  puntos  que  forman  parte  del  conjunto  M.(f)  se  encuentran  los 
siguientes: 


(a)  Los  puntos  críticos  de  /,  es  decir,  puntos  para  los  cuales  f\x o)  =  0.  Notemos  que 
geométricamente  estos  puntos  se  caracterizan  porque  la  tangente  a  la  gráfica  de  /  es 
horizontal. 

(b)  Las  preimágenes  de  los  puntos  críticos,  es  decir,  puntos  x$  tales  qne  f'(xn )  =  0,  siendo 
xn  =  Nf(x  o). 

(c)  Los  n-ciclos  de  período  n  >  2  de  Nf,  así  como  los  puntos  que  son  atraídos  por  dichos 
ciclos. 


Así,  podemos  precisar  un  poco  más  a  la  hora  de  clasificar  los  puntos  contenidos  en  el 
conjunto  Denotamos 


A(f)  =  {x  G  M  :  existe  m  =  m{x)  G  N  tal  que  A^™(x)  G 


(3.6) 
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donde  Z(g)  =  {x  G  M  :  g(x )  =  0}  es  el  conjunto  de  los  ceros  de  la  función  g.  Notemos  que 
A(f)  está  formado  por  las  preimágenes  de  los  puntos  críticos  de  /: 

Aí)  =  U 

meN 

Toda  vez  que  la  función  /  tiene  un  cero  t  los  puntos  críticos  de  /  son  aislados,  se  cumple  que 
A(f)  es  numerable  y  no  denso  en  M. 

Englobamos  dentro  del  conjunto 

C(f)  =  M(f)  -  A(f)  (3.7) 

a  los  puntos  con  la  dinámica  más  complicada  respecto  a  la  función  de  iteración  Nf. 

Los  siguientes  ejemplos  nos  muestran  algunas  de  las  formas  que  puede  tomar  el  conjunto 
_A/Í(/)  para  distintas  funciones  /. 

Ejemplo  3.1.  Si  f(x)  =  x2  —  1  entonces  Aí(f)  tiene  un  sólo  un  punto:  M.(f)  =  {0}. 

En  efecto,  como  veremos  con  más  detalle  en  la  siguiente  sección,  en  este  caso  se 
tiene  que  si  se  parte  de  x0  >  1  se  obtiene  una  sucesión  monótonamente  decreciente 
a  la  raíz  a  =  1.  Si  se  parte  de  xq  G  (0, 1),  entonces,  x\  >  1  y  a  partir  de  aquí 
se  obtiene  una  sucesión  monótonamente  decreciente  a  la  misma  raíz  anterior.  El 
comportamiento  para  puntos  de  partida  negativos  es  simétrico,  obteniéndose  en 
este  caso  sucesiones  convergentes  hacia  la  otra  raíz,  a  =  —  1.  En  consecuencia, 
el  único  punto  de  partida  para  el  cual  no  existen  las  iteraciones  del  método  de 
Newton  es  xq  =  0. 

Ejemplo  3.2.  Si  f(x)  =  x3  —  1  entonces  M.(f)  tiene  infinitos  puntos.  No  obstante,  el 
conjunto  M.(f)  tiene  medida  cero. 


En  este  caso,  la  función  de  iteración  del  método  de  Newton  es  de  la  forma 

2a:3  +  1 
3a:2  ’ 

que  no  está  definida  en  el  punto  x  —  0  y  en  el  conjunto  de  sus  preimágenes  (un 
conjunto  numerable  de  puntos). 

Ejemplo  3.3.  Si  f(x)  =  25a:3  —  16a:  —  9  entonces  M(f)  tiene  infinitos  puntos.  Además,  en 
este  caso  M.(f)  es  un  conjunto  de  medida  positiva. 

En  este  caso,  la  función  de  iteración  del  método  de  Newton  N ¡(x)  tiene  un  2-ciclo 
atractor  de  la  forma 


{0.011036,-0.562826}. 
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Es  más,  la  función  g(x)  =  Nj(x)  tiene  un  único  punto  fijo  en  el  intervalo  [—0.025,  0.025] 
y  satisface 

\g\x)\  <  1,  x  e  [-0.025,0.025], 

Por  lo  tanto  las  órbitas  de  cualquier  punto  de  partida  a;0  G  [—0.025,  0.025]  se 
verán  atraídas  hacia  el  2-ciclo  anterior.  En  consecuencia 

[-0.025,0.025]  C  M(f). 

Ejemplo  3.4.  El  método  de  Newton  aplicado  al  polinomio  p(x)  =  x3  —  1.265a;  +  1  tiene  una 
2-ciclo  atractor. 


La  función  de  iteración  asociada  es 


Np(x) 


2x 3  -  1 
3a;2  -  1.265  ‘ 


En  una  primera  inspección,  calculamos  la  órbita  del  punto  Xq  =  0; 


orb(a;o)  =  {0,0.79051,-0.019675,0.79125,-0.015043,0.79094, 
-0.016973,  0.79106,  -0.016232, 0.79101  }. 


Esta  prueba  numérica  nos  hace  intuir  la  presencia  de  un  2-ciclo  atractor.  Pa¬ 
ra  demostrar  su  existencia  más  rigurosamente,  consideremos  el  intervalo  /  = 
[—0.03,0.03].  Entonces  se  puede  probar  que: 

(a)  NP(I)  n  /  =  0, 

(b)  Np  :/—>/,  y 

(c)  |(Ar2)/(a;)|  <  1  para  todo  x  <G  /. 

Las  condiciones  (a)  y  (b)  junto  con  el  teorema  del  valor  intermedio  garantizan  la 
existencia  de  un  punto  fijo  de  iV2  que  no  es  un  punto  fijo  de  Np.  Además,  por  (c), 
dicho  punto  fijo  es  un  atractor. 


Ejemplo  3.5.  Determínense  algunos  puntos  de  partida  para  los  cuales  el  método  de  Newton 
aplicado  a  la  función  f(x)  =  2a;3  —  2a;  +  \[2  no  converja  a  ninguna  raíz. 

En  este  caso  Nf(x )  =  (4a;3  —  v/2)/(2(3a;2  —  1)).  Tenemos  que  f'(x)  =  0  si  y  sólo 
si  x  =  ±l/\/3.  En  estos  puntos  la  recta  tangente  al  gráfico  de  /  es  horizontal. 

Por  otra  parte,  notemos  que  iV/(0)  =  \/2/2  y  Nf( y/2/2)  =  0.  Por  lo  tanto, 

|o,  \/2/2|  es  una  órbita  periódica  de  período  2  para  Nf.  Además,  como 

(jV?)'(aO  =  N'(Nf(x))-N'(x) 

f(Nf(x))f" (Nf(x))  f(x)f(x) 

(Wí(x)))2  ’ 
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y  /"(O)  =  O,  se  tiene  que 

2  _  scmrwm  mnv  =  „ 

1  f,[l  (f(V2/2)r  (/'(O))2  ’ 

por  lo  que  jo,  a/2/2}  es  una  órbita  periódica  superatractora  de  Nf.  En  consecuen¬ 
cia,  existe  un  intervalo  /  que  contiene  a  0  tal  que  si  x  G  I,  entonces,  los  iterados 
pares  Njn(x )  — >  0  y  los  iterados  impares  N2n+X  (x)  — >  y/2/2. 


Ejemplo  3.6.  Determínense  algunos  puntos  de  partida  para  los  cuales  el  método  de  Newton 
aplicado  a  la  función  f(x)  =  x3  —  x  no  converja  a  ninguna  raíz. 


Las  raíces  de  la  ecuación  f(x)  =  0,  son  0, 1  y  —1.  La  función  de  iteración  de 
Newton  para  /  es  Nf(x)  =  2x3/(3x2  —  1).  En  este  caso,  tenemos  que  f(x)  =  0 
si  y  sólo  si  x  =  ±\/ 3/3.  Para  estos  valores  de  x  el  método  de  Newton  no  está 
definido. 

Para  ver  si  Nf  tiene  órbitas  periódicas,  por  simetría,  busquemos  un  punto  x  tal 
que  Nf(x )  =  —x,  es  decir, 

2a:3 

3a:2 -1  = 

Al  resolver  esta  ecuación  obtenemos  x  =  0  o  x  =  ±l/\/5-  El  punto  xq  =  0  es  un 
punto  fijo  (superatractor)  de  Nf,  y  los  puntos  xi  =  l/\/5  y  x^  =  — 1/\/5  forman 
una  órbita  periódica  de  período  2,  la  cual  es  repulsora,  pues  (Nj)'  (l/y/ñj  =  36. 

Estos  ejemplos  nos  permiten  intuir  que  el  estudio  de  la  convergencia  global  del  método  de 
Newton  es  un  problema  complicado,  no  sólo  por  la  existencia  de  puntos  donde  la  convergencia 
puede  fallar,  sino  también  porque  en  el  caso  en  el  que  el  método  de  Newton  converge,  puede 
hacerlo  a  una  raíz  distinta  a  la  esperada.  No  siempre  ocurre  que  el  método  de  Newton  converja 
a  la  raíz  más  próxima  al  punto  de  partida.  Así,  si  en  el  último  ejemplo  tomamos  Xq  =  —0.5,  se 
tiene  que  Nf(— 0.5)  =  1.  Además,  si  tomamos  puntos  de  partida  cercanos  a  —0,5,  el  método 
de  Newton  no  converge  a  ninguna  de  las  raíces  más  próximas,  0  ó  —1,  si  no  que  lo  hace  a  la 
raíz  más  alejada,  a  =  1. 

En  el  resto  del  capítulo  nos  centraremos  en  el  estudio  del  comportamiento  dinámico  de 
la  función  de  iteración  del  método  de  Newton  (3.2)  definida  sobre  la  recta  real.  Así,  en  las 
secciones  3.2  y  3.3  analizamos  el  comportamiento  particular  de  Nf(x)  para  polinomios  de 
segundo  y  tercer  grado  respectivamente,  dejando  para  el  resto  de  secciones  el  caso  general. 


3.2.  Método  de  Newton  para  ecuaciones  cuadráticas 

Analizamos  en  esta  sección  del  método  de  Newton  para  aproximar  soluciones  de  las  ecua¬ 
ciones  más  simples  después  de  las  ecuaciones  lineales,  a  saber,  las  ecuaciones  cuadráticas. 
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Notemos  que,  sin  pérdida  de  generalidad,  podemos  suponer  que  tenemos  una  ecuación  de  la 
forma 

f(x)  =  x2  +  Bx  +  C  =  0,  fi,CeR,  (3.8) 

ya  que  toda  ecuación  del  tipo  f(x)  =  ax2+bx+c  con  a  ^  0  se  puede  reducir  a  una  del  tipo  (3.8) 
dividiendo  por  a  y  denotando  B  =  b/a  y  C  =  c/a.  Nótese  que  además  el  comportamiento 
del  método  de  Newton  es  el  mismo  para  ambas  funciones,  es  decir,  Nf{x)  =  N jfx). 

Es  más,  toda  función  cuadrática  del  tipo  (3.8)  puede  reducirse  a  una  del  tipo 

fn(x)  =  x2  -  /i,  /iéR  (3.9) 


mediante  un  cambio  de  coordenadas  afín,  como  se  puso  de  manifiesto  en  el  ejemplo  1.13. 

Como  aplicación  de  este  resultado,  podemos  reducir  el  estudio  del  comportamiento  diná¬ 
mico  del  método  de  Newton  aplicado  a  polinomios  de  segundo  grado  a  los  polinomios  de  la 
familia  uniparamétrica  (3.9). 


Teorema  3.1.  Sean  f(x)  y  ffix)  =  x2  —  ¡jl,  definidos  en  (3.8)  y  (3.9)  respectivamente,  con 
/j  =  ( B 2  —  4C)/4.  Entonces  Nf(x)  es  conjugada  topológicamente  con  N* u(x)  mediante  la 
transformación  afín  h(x)  =  x  —  es  decir,  h^1  o  Nf  o  h(x)  =  Nf  (x). 


Demostración.  En  primer  lugar,  es  una  comprobación  inmediata  que  //t(x)  =  /  o  h(x).  Ade¬ 
más,  como  h'(x)  =  1,  se  sigue  que  f(h(x))  =  (/  o  h)\x)  =  fjjx).  Así, 


h  1  o  Nf  o  h(x) 


h -1 

(M 

h(x) 

i  -  - 

x  — 

U 

/'O 

Nf 

(x). 

_  f(h(x)) ' 
’  f(h(x))t 
f(h(x))  B 
f{h{x ))  2 


□ 

El  siguiente  paso  es  caracterizar,  en  función  del  signo  de  n,  el  comportamiento  del  método 
de  Newton  aplicado  a  un  polinomio  de  la  forma  (3.9).  En  concreto,  el  siguiente  resultado 
muestra  que  el  estudio  de  las  iteraciones  dadas  por  el  método  de  Newton  aplicado  a  un 
polinomio  cuadrático  general,  se  puede  reducir  a  tres  situaciones  particulares,  dependiendo 
de  si  el  polinomio  original  tiene  dos  raíces  reales,  ninguna  raíz  real  o  una  raíz  doble. 

Teorema  3.2.  Sea  la  función  de  iteración  del  método  de  Newton  aplicado  a  un  polinomio 
de  la  forma  (3.9).  Entonces 
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1.  Si  p  >  0  ,  N,j_  es  conjugado  topológicamente  con  la  aplicación  N\  (x),  doride 

x2  +  1 


N^x)  = 


2x 


es  el  método  de  Newton  aplicado  al  polinomio  fi  (x)  =  x2  —  1 . 


2.  Si  p  <  0,  entonces  N„  es  conjugado  topológicamente  con  la  aplicación 


N.  i(x)  = 


x2  —  1 
2x 


que  es  el  método  de  Newton  aplicado  al  polinomio  f-i(x)  =  x2  +  1. 


3.  Si  p  =  0,  nos  queda  la  aplicación  lineal  N0(x)  =  |,  que  es  el  método  de  Newton  aplicado 
al  polinomio  fo(x)  =  x2. 

Demostración.  En  el  primer  caso,  busquemos  una  transformación  afín  H(x)  =  ax  +  /3,  de 
modo  que  tengamos  la  ecuación  de  conjugación 


H  o  =  Ni  o  H.  (3.10) 

Ahora,  H  o  N^(x)  =  aN^(x)  +  (3  y  Ni  o  H(x)  =  ( H(x )2  +  l)/(2 H(x)).  Usando  la  ecuación  de 
conjugación  (3.10),  tenemos  la  ecuación 

(ax2  +  2  (3x  +  ap)(ax  +  (3)  —  x(a2x2  +  2  a/3x  +  /32  +  1) 


que,  después  de  realizar  todas  las  simplificaciones  posibles,  nos  queda  como 

3  a/3x  +  2/32  +  a2p  =  2  a2/3  +  (32  +  1. 

De  aquí,  a/3  =  0  y  como  a  ^  0  se  sigue  que  ¡3  =  0.  También  como  2 ¡32  +  a2p  =  2 a2/3  +  /32  + 1, 
nos  queda  a2p  =  1,  de  donde  a  =  1/ i/p,  concluyendo  que  la  transformación  afín  buscada  es 
H(x)  =  x/yfji. 

En  el  segundo  caso,  como  en  el  caso  anterior,  buscamos  H(x )  =  ax  +  ¡3  afín,  tal  que 
HoN,  =  N_i  o  H ,  lo  que  nos  conduce  a  la  ecuación  a2p  =  —1,  de  donde  a  =  1  ¡ \J—p,  y 
H(x)  =  x/yf—p  es  la  transformación  buscada. 

El  tercer  caso  es  una  comprobación  inmediata.  □ 

Corolario  3.3.  El  comportamiento  dinámico  del  método  de  Newton  aplicado  a  los  polinomios 
de  la  forma  (3.8)  se  reduce  a  tres  casos  particulares,  en  función  del  signo  de  A  =  B2  —  4C, 
el  discriminante  de  la  correspondiente  ecuación  cuadrática.  En  concreto, 

1.  Si  A  =  0,  Nf  es  conjugada  topológicamente  con  N0(x),  el  método  de  Newton  aplicado 
al  polinomio  fo(x)  =  x2. 

2.  Si  A  >  0,  Nf  es  conjugada  topológicamente  con  Afi  (x),  el  método  de  Newton  aplicado 
al  polinomio  fi(x)  =  x2  —  1. 

3.  Si  A  <  0,  entonces  Nf  es  conjugada  topológicamente  con  N_i(x),  el  método  de  Newton 
aplicado  al  polinomio  f~\(x)  =  x2  +  1. 
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El  método  de  Newton  aplicado  al  polinomio  fo(x)  =  x 2 

Esta  situación  es  la  más  fácil  de  las  tres,  ya  que  la  función  de  iteración  del  método  de 
Newton  queda  de  la  forma 

N0(x)  =  |.  (3.11) 

En  consecuencia,  la  sucesión  generada  por  dicha  función  es  xn  =  x0/2n,  por  lo  que  xn  — >  0 
para  todo  xq  G  M.  Nótese  que,  en  este  caso,  la  convergencia  es  lineal. 


El  método  de  Newton  aplicado  al  polinomio  j\{x)  =  x2  —  1 


En  este  caso  la  función  de  iteración  del  método  de  Newton  es 


N^x) 


x2  +  1 
2x 


(3.12) 


El  único  punto  donde  no  está  definida  es  en  x  =  0.  Es  sencillo  comprobar  que  si  Xq  >  1, 
entonces  la  sucesión  xn+\  =  Ni(xn)  es  monótonamente  decreciente  hacia  1,  es  decir,  1  < 
xn+i  <  xn ,  n  >  0. 

Si  0  <  xq  <  1,  entonces  x\  >  1  y  a  partir  de  aquí  se  inicia  la  convergencia  monótona 
decreciente  hacia  1.  En  este  caso,  x0  <  x\  y  1  <  xn+\  <  xn,  n  >  1. 

El  estudio  para  valores  negativos  de  xo  se  puede  hacer  por  simetría,  ya  que  si  yo  =  —  xq, 
con  Xo  >  0,  entonces  si  yn+\  =  N\  (yn)  y  xn+i  =  N{  (xn),  se  tiene  que  yn  =  —xn.  Por  lo 
tanto,  si  y  o  <  —  1,  entonces  la  sucesión  {yn}  es  monótonamente  creciente  a  —1,  mientras  que 
si  —  1  <  yo  <  0,  entonces  t/i  <  -1  y  a  partir  de  aquí,  la  sucesión  crece  hacia  el  límite  —1. 


El  método  de  Newton  aplicado  al  polinomio  fi(x)  =  x2  +  1 

En  este  caso  se  comprueba  que  la  función  de  iteración  obtenida  aplicando  el  método  de 
Newton  al  polinomio  f±(x)  =  x2  +  1: 

,2  _  i 


N-i(x)  = 


x 


2x 


(3.13) 


tiene  un  comportamiento  caótico.  En  concreto,  veamos  que  N_i  es  conjugada  topológicamente 
con  1a.  función  «diente  de  sierra»  definida  en  el  ejemplo  1.16  de  la  siguiente  manera: 


S(x)  = 


2x  si  0  <  x  <  -, 

1 

2x  —  1  si  -  <  x  <  1. 


(3.14) 


En  dicho  ejemplo  ya  se  probó  el  comportamiento  caótico  de  las  órbitas  de  1a.  función  (3.14). 
Considerarnos  la  función  g  :  (0, 1)  — >  R  definida,  por 


g(x)  = 


eos  [tix) 


sen(  ux ) 


3.2.  Método  de  Newton  para  cuadráticas 


103 


Entonces,  se  tiene  que  g  o  S(x)  =  iV_i  o  g(x)  para  todo  x  G  (0, 1/2)  U  (1/2, 1).  En  efecto,  por 
una  parte  se  tiene  que 


N_1og(x) 


1  —  tg2(7uc) 
2tg(vre) 


1 

tg(27Tx)‘ 


Por  otra  parte,  si  x  G  (0, 1/2),  entonces 

g  o  S(x)  =  g(2x) 


1 

tg(27nr) ' 


Si  x  G  (1/2, 1),  entonces 

goS{x)  =  g{2x  —  1) 


1 

tg(27TX  —  7 r) 


1 

tg(27nr)  ‘ 


Por  lo  tanto,  en  ambos  casos  se  tiene  que  g  o  S(x)  =  iV_i  o  g(x). 
Además,  si  tenemos  en  cuenta  que 


lím  g  o  S(x)  =  —oo  =  lím  iV_i  o  g(x),  lím  g  o  S(x)  =  oo  =  lím  A^_i  o  g(x), 

x— >0+  te— >0+  x—>l~  x—>l~ 

la  igualdad  g  o  S(x)  =  N_i  o  g[x)  se  puede  extender  al  intervalo  [0, 1],  definiendo  g(0)  =  —oo; 
g(  1)  =  oo ;  N_i(— oo)  =  — oo  y  A’_1(oo)  =  oo. 

Como  el  comportamiento  del  sistema  dinámico  (X,  S),  con  X  =  [0,1]  y  S  definida 
en  (3.14),  es  caótico  (véase  el  ejemplo  1.16),  también  lo  es  el  de  la  función  iV_i  sobre  to¬ 
da  la  recta  real. 


Figura  3.1:  Gráfico  de  Nq  en  M  y  gráfico  de  su  compactificación  No  en  el  intervalo  [0, 1]. 

Para  terminar  esta  sección,  a  modo  de  resumen,  mostramos  los  gráficos  de  algunas  itera¬ 
ciones  del  método  de  Newton  aplicado  a  los  tres  polinomios  a  los  que  se  reduce  el  estudio  para 
polinomios  cuadráticos,  junto  con  sus  correspondientes  compactificaciones  al  intervalo  [0, 1], 
entendiendo  por  compactificación  de  una  función  f(x)  definida  en  la  recta  real  como  otra 
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Figura  3.2:  Gráfico  de  Ni  en  M  y  gráfico  de  su  compactificación  Ni  en  el  intervalo  [0, 1]. 


Figura  3.3:  Gráfico  de  lV_i  en  M  y  gráfico  de  su  compactificación  JV_i  en  el  intervalo  [0, 1]. 

función  que  es  conjugada  topológicamente  con  f(x),  pero  que  está  definida  en  un  intervalo 
finito. 

Para  obtener  dichas  compactificaciones,  se  considera  la  aplicación  G  :  M  — >  (0, 1)  dada 

por 

G(x)  =  —  arctg(x)  +  -. 

7 T  2 

Esta  función  es  un  homeomorfismo  de  M.  en  el  intervalo  (0, 1).  Por  lo  tanto,  para  las  funcio¬ 
nes  N0,  Ni  y  N_i  introducidas  en  (3.11),  (3.12)  y  (3.13)  respectivamente,  construimos  las 
compactificaciones 


■  Ñ0  :  (0, 1)  — >  (0, 1)  definida  por  Ñ0(x )  =  (G  o  N0  o  G^1)(a:); 

■  Ñi  :  (0, 1)  — >  (0, 1)  definida  por  Ñi(x)  =  (G  o  Ni  o  G_1)(a:); 

■  Ñ_i  :  (0, 1)  — >  (0, 1)  definida  por  Ñ_i(x)  —  (G  o  N_i  o  G~1)(x). 
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Además,  si  introducimos  las  notaciones 

G(— oo)  =  lím  G(x)  =  0,  G(+oo)  =  lím  G(x)  =  1, 
y  tenemos  en  cuenta  que 

lím  N0(x)  =  lím  Ni(x)  =  lím  N_i(x)  =  oo, 


lím  Nq(x)  =  lím  Ai(;r)  =  lím  N-Ax)  =  —  oo, 

x — > — oo  oo  x — > — oo 

podemos  extender  cualquiera  de  las  tres  compactificaciones  a  un  aplicación  definida  en  [0, 1]. 
Usamos  la  misma  notación  para  esta  extensión.  Notemos  que  las  funciones  extendidas  tienen 
aa;  =  0yaa;  =  l  como  puntos  fijos  adicionales  a  los  puntos  fijos  que  corresponden  a  las 
raíces  del  polinomio  en  cuestión. 


3.3.  Método  de  Newton  para  polinomios  cúbicos 


En  la  sección  anterior  ya  observamos  que  el  método  de  Newton  puede  presentar  un  com¬ 
portamiento  caótico  para  algunos  polinomios  cuadráticos.  Ahora  bien,  para  polinomios  cú¬ 
bicos,  el  comportamiento  de  la  transformada  de  Newton  es  más  interesante  desde  el  punto 
dinámico,  con  la  aparición  de  fenómenos  interesantes  como  las  cascadas  de  bifurcaciones. 

En  esta  sección  analizamos  la  dinámica  de  la  función  de  iteración  del  método  de  Newton 


Np(x) 


p(x ) 
p'(x )  ’ 


donde  p(x)  es  un  polinomio  cúbico  de  la  forma 


p(x)  =  a;3  +  bx2  +  ex  +  d,  b,c,d  G  M. 


(3.15) 


Podemos  suponer,  sin  pérdida  de  generalidad  que  p(x)  es  mónico  ya  que  la  función  de  iteración 
del  método  de  Newton  es  la  misma  para  los  polinomios  Ax3  +  Bx 2  +  Cx  +  D  (A  ^  0)  y 
x3  +  bx2  +  cx  +  d  con  b  =  B/A,  c  =  C/A  y  d  =  D/A. 

El  número  de  parámetros  implicados  en  el  problema  se  puede  reducir  a  dos,  teniendo  en 
cuenta  el  siguiente  resultado. 

Lema  3.4.  Sea  p(x)  un  polinomio  de  la  forma  (3.15)  y  sea  t(x)  =  3 x  +  b.  Entonces  Np  es 
conjugada  topológicamente  con  Nq,  la  función  de  iteración  del  método  de  Newton  aplicada  al 
polinomio 

q(x)  =  x3  +  \x  +  7,  (3.16) 


donde  A  =  9c  —  3b2  y  7  =  2 b3  —  9 (be  —  3 d)  =  27 d  +  2 b3  —  9 be. 
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Demostración.  En  primer  lugar,  notemos  que 


Np(x) 


2x3  +  bx 2  —  d 
3x2  +  2  bx  +  c 


y  Nq(x) 


2  x3  -C 
3x2  +  B ' 


Entonces 


r  o  Np(x ) 


6a;3  +  66a;2  +  262a;  +  be  ~  3d 
3x2  +  26a;  +  c 


y 


iVg  o  r(a;) 


54a;3  +  546a;2  +  1862a;  +  263  —  7 
27a;2  +  186a;  +  362  +  A 


Teniendo  en  cuenta  los  valores  de  A  y  7  dados  en  el  enunciado  del  teorema,  se  sigue  que 
r  o  Np(x)  =  Nq  o  t(x),  es  decir,  Np  y  Nq  son  conjugadas  topológicamente.  □ 


Pero  aún  se  puede  reducir  más  el  estudio  del  método  de  Newton  para  polinomios  cúbicos, 
sin  necesidad  de  considerar  todos  los  polinomios  definidos  en  (3.16).  En  concreto,  el  siguiente 
resultado  prueba  que  basta  con  estudiar  el  método  de  Newton  en  cuatro  situaciones  concretas. 


Teorema  3.5.  Sea  Nq  la  función  de  iteración  del  método  de  Newton  aplicado  a  un  polinomio 
de  la  forma  (3.16),  es  decir, 


N,(x) 


2x3  —  7 
3a;2  +  A ' 


Entonces 


1.  Si  A  =  7  =  0,  entonces  Nq( x)  =  N0(x)  =  2x/3,  que  es  el  método  de  Newton  aplicado  al 
polinomio  po(x)  =  x3,  que  es  un  polinomio  con  una  raíz  triple  en  x  =  0. 

2.  Si 'y  =  0  y  A  >  0,  entonces  Nq(x)  es  conjugada  topológicamente  con  la  aplicación  N+(x), 
donde 


N+(x)  = 


2ar 


3a;2  +  1 

es  el  método  de  Newton  aplicado  al  polinomio  p+(x)  =  x3  +  x,  que  es  un  polinomio  con 
una  raíz  real  y  dos  complejas  conjugadas. 

3.  Sij  =  0  y  A  <  0,  entonces  Nq(x)  es  conjugada  topológicamente  con  la  aplicación  N_{x), 
donde 

2r3 

NJx )  = 


3x2  -  1 

es  el  método  de  Newton  aplicado  al  polinomio  p_  (x)  =  x3  —  x,  que  es  un  polinomio  con 
tres  raíces  reales  diferentes. 

4-  Si  7  0,  entonces  Nq(x)  es  conjugada  topológicamente  con  la  aplicación  Nc(x),  donde 


Nc(x)  = 


2x3  -  1 


3a;2  +  c 

es  el  método  de  Newton  aplicado  al  polinomio  pc(x)  =  x3  +  ex  +  1. 


(3.17) 
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Demostración.  El  primer  caso  es  una  comprobación  inmediata.  Para  ver  el  segundo  caso, 
consideremos  la  transformación  afín  h{x)  =  y/Xx.  Entonces  tenemos 

h-  o  Nqo  h{x)  =  h 

1  2X\/Xx3 
\/~X  3Xx 2  +  A 
2a;3 

=  3SíTT  =  ív+(i)' 

El  tercer  caso  es  análogo,  pero  considerando  la  transformación  afín  h(x)  =  \J\X\x. 

En  el  cuarto  caso,  escribimos  el  polinomio  (3.15)  de  la  forma  q(x)  =  x3  +  Xx  +  /33,  es  decir, 
con  7  =  (33 .  Entonces,  para  r{x)  =  x/ ¡3  se  tiene  que  r  o  Nq  =  Nc  o  r  con  pc(x)  =  x3  +  ex  +  1 

y  c  =  x/(32.  □ 

A  continuación  estudiamos  con  más  detalle  cada  uno  de  los  casos  que  se  presentan  en  el 
teorema  3.5. 


El  método  de  Newton  aplicado  al  polinomio  fo(x)  =  x3 

En  este  caso  la  función  de  iteración  del  método  de  Newton  es  N0(x)  =  2x/3.  Por  lo  tanto, 
la  sucesión  generada  por  dicha  función  es  xn  =  ( 2/3)uxq ,  por  lo  que  xn  — >  0  para  todo  xq  G  M. 
Nótese  que,  en  este  caso,  la  convergencia  es  lineal. 


El  método  de  Newton  aplicado  al  polinomio  f+(x)  =  x3  +  x 


En  este  caso,  el  único  punto  fijo  de  la  correspondiente  función  de  iteración  del  método  de 
Newton 


N+(x) 


2x3 

3x2  +  1 


es  x  =  0.  Es  sencillo  comprobar  que  si  xQ  >  0,  entonces  la  sucesión  xn+i  =  N+(xn)  es 
monótonamente  decreciente  hacia  0,  es  decir  0  <  xn+\  <  xn,  n  >  0.  Teniendo  en  cuenta  la 
simetría  respecto  al  origen  de  la  función  Aú|_,  se  tiene  que  para  puntos  de  partida  xq  <  0  se 
obtiene  una  sucesión  que  crece  monótonamente  hacia  0. 


El  método  de  Newton  aplicado  al  polinomio  /_(  X ^  —  X  X 


Para  las  iteraciones  de  la  función  asociada  a  f~(x)  =  x3  —  x, 


N_(x) 


2x3 

3x2  —  1  ’ 


existen  tres  puntos  fijos,  que  corresponden  a  las  raíces  rq  =  —  1,  rq  =  0  y  =  1.  En  este  caso 
no  es  sencillo  decidir  hacia  que  raíz  se  aproximan  las  iteraciones  de  un  punto  arbitrario. 
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Como  en  el  caso  de  las  aplicaciones  cuadráticas,  consideramos  la  aplicación  G  :  M  — »  (0, 1) 
dada  por 

G(x )  =  —  arctg(x)  H — 

7T  2 

y  la  correspondiente  compactificación  de  la  función  AL:  AL  :  (0, 1)  — >  (0, 1)  definida  por 

Ñ_(x)  =  (G  o  AL  o  G_1)(x). 

Notemos  que  G(— 1)  =  1/4,  G(0)  =  1/2  y  G(l)  =  3/4,  y  las  asíntotas  verticales  están 
sobre  los  puntos  ü\  =  —  \/3/3  y  a2  =  \/3/3,  que  son  llevadas  por  G  en  los  puntos  =  1/3 
y  ¿2  =  2/3.  La  preimagen  a  por  N  de  ai  =  1/3,  distinta  de  este  punto  fijo,  determina 
un  intervalo  1-2  =  (a,á 2),  de  modo  que  las  iteraciones  por  AL  de  puntos  en  ese  intervalo 
convergen  al  punto  fijo  1/4,  de  modo  análogo,  tenemos  un  punto  /3,  preimagen  por  AL  de  2/3, 
determina  un  intervalo  I\  =  (ñi  ,/3),  de  modo  que  las  iteraciones  de  puntos  en  ese  intervalo 
por  AL  convergen  al  punto  fijo  3/4.  Hay  una  cantidad  numerable  de  puntos  donde  no  se 
tiene  convergencia  correspondientes  a  la  unión  de  las  preimágenes  por  AL  de  las  asíntotas 
verticales  ái  y  02,  es  decir,  el  conjunto  A  =  U«eN  -^rLn({üi,  ¿L}),  y  existe  un  conjunto  abierto 
constituido  por  la  unión  de  las  preimágenes  de  las  cuencas  de  atracción  de  los  puntos  fijos 
1/4  y  3/4,  las  cuales  aparecen  intercaladas,  es  decir,  Ur)eN(^rLn(0,  ái)  U  Ñzn((Í2, 1)).  Como 
se  observa,  decidir  a  cuál  de  los  puntos  fijos  convergen  las  iteraciones,  no  es  una  tarea  fácil 
en  este  caso.  Para  mayores  detalles,  el  lector  puede  consultar  [154], 

El  método  de  Newton  aplicado  al  polinomio  fc(x )  =  x3  +  ex  +  1 

Esta  situación  esconde  una  gran  riqueza  desde  el  punto  de  vista  dinámico.  De  hecho, 
podemos  encontrar  una  cáscada  de  bifurcaciones  de  período,  que  recuerdan  al  diagrama  de 
Fcigenbaum  visto  para  la  función  logística  en  el  capítulo  1. 

Para  el  polinomio  fc(x),  consideramos  la  correspondiente  función  de  iteración  del  método 
de  Newton  (3.17).  Como 

Y//  \  _  fc(x)fc(x)  _  6x(x 3  +  ex  +  1) 
f'(x)2  3  x2  +  c 

el  único  punto  crítico  libre  de  Nc(x)  es  x  =  0.  Para  obtener  valores  de  c  para  los  cuales 
Nc(x )  tiene  un  ciclo  de  la  forma  0  i—»  X\  i—»  X2  i—»  £3  i—»  •  •  •  1— >  xn  i—»  0,  debemos  resolver  las 
ecuaciones 

ATc2(0)  =  Nc  o  Arc(0)  =  0,  AT?(0)  =  N2  o  A^O)  =  0,  AC(0)  =  N¡  o  A^O)  =  0, 


y  así  sucesivamente,  de  este  modo  obtenemos  aquellos  valores  de  c  para  los  cuales  Nc  tiene  un 
ciclo  superatractor  que  contiene  a  x  =  0,  y  por  continuidad,  obtenemos  valores  del  parámetro 
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para  los  cuales  Nc(x)  tiene  un  ciclo  atractor  del  mismo  período  que  el  ciclo  que  contiene  al 
punto  0.  En  concreto,  la  ecuación  7V2(0)  =  0  viene  dada  por 


ÍVC2(0) 


2  +  c3 
c(c3  +  3) 


0. 


Dicha  ecuación  tiene  como  solución  real  c\  ~  —1.25992.  Así  obtenemos  el  ciclo  xo  =  0  i— ► 
X\  ~  0.79370  i— >  x2  =  x0. 

La  próxima  ecuación  a  resolver  es  N*( 0)  =  0,  la  cual  tiene  varias  soluciones  reales,  la 
primera  después  de  C\  es  c2  ~  —1.27816  (mirando  desde  la  derecha  a  la  izquierda),  para  la 
cual  NC2  tiene  un  4-ciclo: 


i0  =  0  w  0.78237  i— >  x2  ~  —0.07561  i— >  x3  «  0.79370  i— *  rr4  =  x0. 

La  próxima  solución,  correspondiente  a  jV®( 0)  =  0,  es  C3  ~  —1.29376,  para  cual  NC3  tiene 
el  8-ciclo  siguiente: 


xq  =  0  1— >  x\  fu  0.77294  1— »  x2  ~  —0.15331  1— >  x3  0.82339  1-^x4^  0.15734  1— ► 


x5  ~  0.81363  1— >  x6  ~  0.11156  X7  «  0.79370  x8  =  a;0. 

Las  figuras  3.4  y  3.5  muestran  los  ciclos  superatractores  que  hemos  encontrado. 


Figura  3.4:  Órbita  de  0  por  NCl  (un  2-ciclo)  y  órbita  de  0  por  NC2  (un  4-ciclo). 

Las  ecuaciones  para  obtener  ciclos  de  mayor  período  para  Nc  vienen  dadas  por  funciones 
racionales  en  c,  con  numerador  de  un  grado  muy  alto.  El  estudio  dinámico  de  las  funcio¬ 
nes  (3.17)  da  lugar  a  un  diagrama  de  bifurcación  como  el  que  se  muestra  en  la  figura  3.6. 
Esta  figura  guarda  una  cierta  similitud  con  el  diagrama  de  Feighenbaum  (véase  la  figura  1.11) 
para  la  ecuación  logística  y,  al  igual  que  él,  muestra  los  valores  del  parámetro  c  para  los  cuales 
el  método  de  Newton  aplicado  a  un  polinomio  de  la  familia  (3.17)  tiene  un  punto  fijo,  a  partir 
de  cuándo  aparece  un  2-ciclo,  un  4-ciclo,  etc. 
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Figura  3.5:  Órbita  de  O  por  NC3  (un  8-ciclo). 


Figura  3.6:  Diagrama  de  bifurcación  para  la  familia  uniparamétrica  (3.17).  En  el  eje  de 
abcisas  aparecen  los  valores  del  parámetro  c  y  en  el  eje  de  ordenadas  los  límites  de  la 
correspondiente  sucesión  generada  por  el  método  de  Newton,  apreciándose  la  aparición  de 
2-ciclos,  4-ciclos,  etc. 

3.4.  Propiedades  básicas  de  la  función  de  iteración  del 
método  de  Newton 

Como  hemos  comentado  en  la  sección  anterior,  la  propiedad  fundamental  de  la  función  de 
iteración  de  Newton,  Nf,  de  una  cierta  función  /,  es  que  transforma  el  problema  de  encontrar 
las  raíces  de  la  ecuación  f(x)  =  0  en  el  problema  de  encontrar  los  puntos  fijos  de  Nf.  En  esta 
sección  vamos  a  realizar  un  estudio  más  detallado  de  la  función  de  iteración  del  método  de 
Newton  (3.2)  para  funciones  /  :  M.  — »  M.  suficientemente  derivadles.  Para  simplificar  nuestro 
estudio,  supongamos  que  /  satisface  las  condiciones  siguientes: 

C.l  Si  f'{x)  =  0,  entonces  f"{x )  ^  0,  es  decir,  los  puntos  críticos  (máximos  o  mínimos)  de 
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Figura  3.7:  Posibles  gráficos  de  f(x)  en  una  banda  (ci,C2)  que  contiene  una  raíz  a  de  f(x)  =  0. 


/  son  no  degenerados. 

C.2  Si  f(x)  =  0,  entonces  f'(x)  ^  0.  Es  decir,  /  sólo  tiene  raíces  simples.  Geométricamente 
si  /(a)  =  0  y  /'(a)  ^  0  entonces  /  es  transversal  al  eje  OX  en  el  punto  (a,  0),  o 
equivalentemente  el  gráfico  de  /  cruza  en  el  punto  (cc,  0)  el  eje  de  las  abscisas  con  un 
ángulo  no  cero. 

Las  siguientes  propiedades  son  básicas  para  el  estudio  de  las  iteraciones  de  Nf. 

(1)  /(a)  =  0  si  y  sólo  si  Nf(a )  =  a.  Además,  si  /(a)  =  0  entonces  Nf(o¿)  =  0,  es  decir,  a  es 
un  punto  fijo  superatractor  y  límfc^oc  N^(x)  =  a  para  todo  x  suficientemente  próximo 
a  a. 


(2)  Nf  tiene  una  asíntota  vertical  en  cada  solución  real  x  =  c  de  f'{x)  =  0. 

Si  Ci  <  c2  son  dos  raíces  consecutivas  de  f'(x)  =  0,  el  intervalo  (ci,c2)  se  llama  una 
banda  acotada  para  Nf.  Si  c  es  la  mayor  de  las  raíces  de  f(x)  =  0,  entonces  el  intervalo 
(c,  +oo)  es  una  banda  extrema  de  Nf.  Análogamente,  si  b  es  la  menor  de  las  raíces  de 
f'{x)  =  0,  entonces  el  intervalo  (— oo,b)  es  la  otra  banda  extrema  de  Nf. 

(3)  Si  (ci,  c2)  es  una  banda  para  Nf  que  contiene  una  raíz,  a,  de  f(x)  =  0,  entonces 


lím  Nf(x)  =  +oo,  lím  Nf(x)  =  —oo. 


En  efecto,  como  f'(x)  tiene  signo  constante  en  (ci,  c2), tenemos  dos  posibilidades  para 
el  gráfico  local  de  /  en  el  intervalo  (ci,  c2),  que  son  las  que  se  muestran  en  la  figura  3.7. 

En  el  primer  caso,  para  x  G  (ci,  a),  se  tiene  que  f(x)  >  0  y  f(x)  <  0.  Luego 

j  íx) 

lím  Nf(x)  =  lím  x - — —  =  oo. 

x^c+  x^c+  f(x) 

En  el  intervalo  (a,c2),  f(x)  <  0  y  f(x)  <  0.  Luego 


lím  N f(x)  =  lím  x 


f{x) 

/'O) 


=  — (X). 
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El  segundo  caso  es  completamente  análogo. 

(4)  Si  (ci,  c2)  es  una  banda  de  Nf,  que  no  contiene  raíces  de  f(x)  =  0,  entonces 

lím  Nf(x)  =  lím  Nf(x )  =  ±cx). 

x — >C+  X — >c“ 

En  efecto,  en  este  caso  basta  observar  las  posibles  gráficas  de  /  que  se  muestran  en  la 
figura  3.8  para  deducir  el  resultado. 


Figura  3.8:  Posibles  gráficos  de  f(x)  en  una  banda  (ci,c2)  que  no  contiene  ninguna  raíz  a 
de  f(x)  =  0. 


(5)  Los  puntos  extremos  locales  de  Nf,  si  f(x)  ^  0,  son  los  puntos  para  los  cuales  f(x)  =  0 
o  f"(x)  =  0,  esto  es,  los  ceros  y  los  puntos  de  inflexión  de  /.  En  efecto,  tenemos  que 
Nf{x)  =  f{x)f"{x)/f\xf  =  0  si,  y  sólo  si,  f(x)  =  0  o  f"(x)  =  0. 

(6)  Si  una  banda  de  Nf  no  contiene  una  raíz  de  f(x)  =  0  entonces  una  de  las  bandas 
adyacentes  o  una  banda  extrema  no  contiene  raíces  de  f(x)  =  0.  Esta  propiedad  fre¬ 
cuentemente  vale  también  para  bandas  extremas.  Una  condición  suficiente  para  que 
esta  propiedad  sea  verdadera  para  bandas  extremas  es  que  f"{x)  sea  siempre  acotada 
desde  0  cuando  |a:|  — >  +oo.  Por  ejemplo  los  polinomios  tienen  esta  propiedad,  sin  em¬ 
bargo  esta  falla  para  f(x)  =  xe~x.  En  este  caso  tenemos  que  f{x)  =  0  si,  y  sólo  si, 
x  —  0.  Además,  f'(x)  =  e-*(l  —  x).  Luego  las  asíntotas  de  Nf,  que  son  las  soluciones 
de  f'{x)  =  0,  se  reducen  a  solamente  x  —  1.  Pero  entonces, 

—  r  2  2 

xe  x  x 

e~x{l  —  x)  1  —  x  x  —  1 

En  este  caso,  Nf  tiene  dos  bandas:  (— oo,  1)  y  (l,oo).  En  la  banda  (1,  oo)  no  hay 
ninguna  raíz  de  /  y,  sin  embargo,  sí  que  la  hay  en  la  otra  banda.  Por  lo  tanto,  la 
función  f{x)  =  xe~x  no  cumple  la  propiedad  (6). 

Finalmente  de  las  propiedades  (1)— (6) ,  el  gráfico  típico  de  Nf,  con  /  que  satisface  C.l  y 
C.2,  es  como  el  que  se  muestra  en  la  figura  3.9. 
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Figura  3.9:  Gráfico  del  método  de  Newton  para  una  función  arbitraria. 

3.5.  No  convergencia  del  método  de  Newton:  indefini¬ 
ción  de  las  iteraciones 

Nuestro  objetivo  ahora  es  el  de  determinar  la  estructura  topológica  de  C(f )  y  caracterizar 
la  dinámica  de  la  función  de  iteración  Nf  restringida  al  conjunto  C(f).  Para  ello,  se  pueden 
dar  los  siguientes  resultados,  cuyas  demostraciones  pueden  verse  en  [117]. 

Proposición  3.6.  Los  conjuntos  B(f),  A(f)  y  C(f),  definidos  en  (3. 4),  (3.6)  y  (3.7)  res¬ 
pectivamente,  son  invariantes  por  la  función  de  iteración  Nf  definida  en  (3.2). 

Mostraremos  a  continuación  que  bajo  ciertas  condiciones  adicionales,  el  conjunto  C(f)  es 
no  numerable  y  contiene  infinitas  órbitas  periódicas  de  Nf. 

Lema  3.7.  Toda  banda  (ci,c2)  que  contenga  una  raíz  a  de  la  ecuación  (3.1)  contiene  una 
órbita  periódica  de  período  2  de  la  función  de  iteración  Nf  definida  en  (3.2). 

Lema  3.8.  Sea  g  :  D  C  M.  — >  M.  Supongamos  que  ii, . . . ,  k  >  2  son  intervalos  compactos 
disjuntos  dos  a  dos,  y  que  para  cada  j  —  1,  2, . . . ,  k,  la  restricción  de  g  al  intervalo  Ij,  g\jj  es 
continua.  Si  para  cada  m  e  N  se  cumple  que 

k 

U  h  C  9{Im), 

3= 1 

entonces  g  tiene  puntos  periódicos  de  todos  los  períodos.  De  hecho  para  cada  n  G  N  existen 
kn  puntos  que  satisfacen  la  ecuación  gn(x )  =  x,  y  la  clausura  del  conjunto  de  los  puntos 
periódicos  es  no  numerable  e  invariante. 
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La  siguiente  proposición,  es  una  generalización  de  un  resultado  probado  por  Barna  en 
1956  para  polinomios  de  grado  n  >  4,  con  coeficientes  reales  y  con  n  raíces  reales  distintas. 

Proposición  3.9.  Supongamos  que  f  satisface  las  condiciones  C.l  y  C.2,  y  tiene  al  menos  4 
raíces  reales  distintas.  Entonces  la  función  de  iteración  del  método  de  Newton,  Nf,  definida 
en  (3.2)  tiene  puntos  periódicos  de  todos  los  períodos.  Además,  A(f)  U  C(f)  ( esto  es,  el 
conjunto  de  puntos  que  no  convergen  a  una  raíz  de  f,  equivalentemente  el  conjunto  de  puntos 
que  no  convergen  a  un  punto  fijo  de  Nf )  es  no  numerable. 

Para  el  caso  de  polinomios  de  grado  n  >  4  con  coeficientes  reales  y  n  raíces  reales  distintas, 
se  tiene  una  información  más  precisa. 

Teorema  3.10  (Barna,  [11]— [14] ,  Cosnard  y  Masse,  [36]).  Sea  f  un  polinomio  de  grado  n  con 
coeficientes  reales.  Supongamos  que  n  >  4,  y  que  f  tiene  n  raíces  reales  distintas.  Entonces 

(i)  C(f)  es  un  conjunto  de  Cantor  con  medida  de  Lebesgue  cero. 

(ii)  C(f)  contiene  órbitas  periódicas  de  todos  los  períodos  de  Nf.  Además,  para  cada  x  G 

C(f),  N'f(x)  <  -1. 

El  teorema  anterior  garantiza,  bajo  sus  hipótesis,  que  para  casi  todo  x  G  M.  los  iterados 
Nff  x)  convergen  hacia  alguna  raíz  de  /,  pues  C(f)  U  A(f)  tiene  medida  de  Lebesgue  cero 
(. A(f )  es  numerable).  Más  aún,  el  conjunto  C(f)  es  repulsor,  luego  inaccesible  computacio- 
nalmente  hablando. 

Definamos  ahora  números  a  y  ¡3  como  sigue: 

(1)  a  es  el  número  de  bandas  extremas  de  N¡  que  no  contienen  puntos  fijos  de  Nf  y  que 
además  son  aplicadas  en  M  por  Nf.  Es  claro  que  a  =  0, 1  ó  2. 

(2)  P  es  el  número  de  bandas  limitadas  de  Nf  que  contienen  puntos  fijos  de  Nf. 

Teorema  3.11.  Supongamos  que  f  satisface  las  condiciones  C.l  y  C.2.  Si  a  +  ¡3  >  2,  existe 
un  conjunto  no  numerable  de  puntos  x  tales  que  Nff  x)  no  converge  a  ningún  punto  fijo  de 
Nf.  Además,  si  (3  >  1  entonces  Nf  tiene  puntos  periódicos  de  todos  los  períodos. 

Demostración.  Si  ¡3  =  0  entonces  a  =  2  luego  Nf  no  tiene  puntos  fijos  y  lo  afirmado  es  trivial. 
Si  (3  >  2  el  resultado  se  sigue  del  lema  3.8. 

Los  casos  restantes  son  a  =  ló2y/3>l.  En  estos  casos  existe  al  menos  una  banda 
extrema  B  con  Nf(B)  =  M,  y  podemos  elegir  intervalos  I\  C  B  e  I2  contenido  en  una  banda 
que  contiene  un  punto  fijo  de  Nf,  tales  que  1)  U  /2  C  Nf(I2)  y  I\  U  I2  C  N f{I\).  La  prueba 
ahora  sigue  como  en  el  lema  3.8.  □ 

Nota  3.1.  En  el  caso  a  =  2y/3  =  0enel  teorema,  hay  bandas  externas  B\,  B2  tales  que 
BiUB2  =  0  con  las  propiedades  BiCB2  C  Nf(Bi)  y  B\CB2  C  Nf(B2);  aplicando  el  lema  3.8 
obtenemos  el  resultado. 
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Figura  3.10:  Gráficos  de  funciones  de  iteración  asociadas  al  método  de  Newton.  A  la  izquierda 
se  muestra  una  situación  con  dos  bandas  extremas  que  contienen  puntos  fijos  y  ninguna  banda 
interna  con  puntos  fijos.  A  la  derecha  se  muestra  una  situación  con  una  banda  extrema  y 
una  banda  interna  con  puntos  fijos. 


3.6.  No  convergencia  de  la  iteraciones  del  método  de 
Newton:  existencia  de  órbitas  periódicas  atracto¬ 
ras 


Desde  el  punto  de  vista  de  la  dinámica,  los  resultados  anteriores  son  satisfactorios,  pues 
ellos  indican  que  para  muchas  funciones  /,  Nf  definida  por  (3.2)  tiene  dinámica  complicada, 
incluyendo  una  cantidad  no  numerable  de  puntos  x  para  los  cuales  N*{x)  no  converge  a 
una  raíz  de  la  ecuación  f(x)  =  0,  y  por  otra  parte  este  conjunto  puede  ser  pequeño  en  el 
sentido  de  la  medida  de  Lebesgue,  más  aún  puede  tener  medida  cero.  En  tal  caso  no  debemos 
esperar  (en  sentido  probabilístico)  encontrar  en  la  práctica  tales  puntos  de  no  convergencia. 
Ahora  centraremos  la  atención  en  la  existencia  de  órbitas  periódicas  atractoras  (recuerde 
que  no  estamos  considerando  como  órbitas  periódicas  a  los  puntos  fijos).  Si  Nf  tiene  órbitas 
periódicas  atractoras  entonces  existe  un  intervalo  abierto  /  tal  que,  si  x  G  /,  entonces  Nf(x) 
no  converge  a  una  raíz  de  /.  Luego  los  puntos  de  /  son  bien  comportados  desde  el  punto  de 
vista  de  la  dinámica,  pero  mal  comportados  desde  el  punto  de  vista  de  las  iteraciones  del 
método  de  Newton. 

Probablemente,  el  resultado  más  antiguo  en  esta  área  es  el  de  Barna  (teorema  3.10),  el 
cual  nos  dice  que  si  /  es  un  polinomio  con  coeficientes  reales  de  grado  mayor  o  igual  que  4, 
con  todas  sus  raíces  reales  y  distintas,  entonces  Nf  no  tiene  órbitas  periódicas  atractoras. 
Sin  embargo,  para  otro  tipo  de  funciones  pueden  existir  órbitas  periódicas  atractoras.  Por 
ejemplo,  para  la  existencia  de  órbitas  de  período  2  basta  con  que  se  cumpla  la  siguiente 
condición  para  algún  intervalo  [a,  b] : 

1.  Nj([a,b])  C  [a,  b], 

2.  \Nf(x)\  <  1  para  todo  x  G  [a,  b], 
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3.  \(Nf)'(x)\  =  \Nf(Nf(x))Nf(x)\  <  1  para  todo  x  G  [a,b\. 

En  algunos  de  los  ejemplos  anteriores  sólo  mostramos  los  gráficos,  y  nos  podemos  plantear 
la  siguiente  pregunta.  Este  tipo  de  gráfico  ¿corresponde  al  gráfico  de  Nf  para  alguna  /? 

La  respuesta  la  obtenemos  en  el  siguiente  resultado. 

Teorema  3.12.  Sea  g  :  M  — >  M  que  satisface 

1)  g  es  de  clase  C2(M),  excepto  en  un  número  finito  de  puntos  {c¿}f=1,  en  los  cuales  g  no 
está  definida,  y  límx^c.  \g(x)\  =  +oo. 

2)  h'rn  +  g(x)  =  -  lím  -  g(x). 

i  i 

3)  g  tiene  un  número  finito  de  puntos  fijos,  cada  uno  de  los  cuales  es  un  punto  crítico  de 
g,  y  cualquier  par  de  esos  puntos  es  separado  por  un  elemento  de  {c¿}f=1. 

4)  g  sólo  tiene  un  número  finito  de  puntos  críticos. 

Entonces  existe  una  función  f  :  M  — >  M,  de  clase  C1(M),  tal  que  g  =  Nf. 

Como  consecuencia  del  teorema  anterior  tenemos  la  siguiente  proposición. 

Proposición  3.13.  Dado  k  >  1,  existen  polinomios  para  los  cuales  la  correspondientes  fun¬ 
ciones  de  iteración  del  método  de  Newton  tienen  órbitas  periódicas  atractoras  de  período  k. 

Demostración.  El  resultado  se  demuestra  a  partir  del  teorema  anterior,  del  teorema  de  apro¬ 
ximación  de  funciones  diferenciadles  por  polinomios  (teorema  de  Stone-Weierstrass)  y  de  la 
estabilidad  de  las  órbitas  periódicas  atractoras  por  perturbaciones  C1.  □ 

A  continuación  mostraremos  una  técnica  que  nos  permite  construir  ciclos  superatractores 
para  el  método  de  Newton.  Aunque  en  este  texto  nos  centraremos  exclusivamente  en  el 
método  de  Newton,  la  técnica  que  vamos  a  desarrollar  se  podría  extender  a  otros  procesos 
iterativos. 

Recordemos  que  una  órbita  periódica  de  longitud  n  o  un  n-ciclo  para  una  aplicación 
F  :  M  — »  M,  es  un  conjunto  finito  de  n  puntos  distintos,  O  =  {aq,  x2,  ■  ■  ■ ,  xn},  que  satisface 
F(xí)  =  xi+1,  para  i  =  1, . . . ,  n  -  1  y  F(xn)  =  x1. 

Consideremos  una  función  /  :  M  — >  M,  derivable.  Al  aplicar  el  método  de  Newton, 
obtenemos  una  aplicación  Nf  :  Dom(Nf)  — >  M,  definida  por  Nf(x)  =  x  —  f(x)/f\x). 
Sin  perdida  de  generalidad  vamos  a  suponer  que  N /(aq)  =  xi+í  para  i  =  1,  ...,n  —  1  y 
Nf(xn)  —  :x\.  Si  esto  ocurre,  claramente  O  es  un  /r-ciclo  para  Nf.  Ahora  desde  las  igualdades 
Xi+ 1  =  N f(xi)  =  Xi  —  f(xi)/f\xi ),  para  i  —  1 . . . ,  n  —  1  y  Nf(xn)  =  xi,  despejando  nos  queda 

el/  \  f  (.Xi)  ■  *  1  ri  /  \  f(Xn)  /r, 

f  (xí)  = - ,  *  =  l,...,n-l,  y  f  (xn)  = - .  (3.18) 

%i-\- 1  %n  •X'l 

Resumiendo  esto,  hemos  probado  la  siguiente  proposición: 
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Proposición  3.14.  Sea  f  :  M  — >  M  derivable  y  sea  O  =  {xi,...,xn}  C  Dom(Nf),  con 
Xi  7^  Xj  para  todo  i,j  e  { 1 , .. . ,  n}.  Entonces  O  es  un  n-ciclo  de  N¡  si  y  sólo  si  f  satisface 
las  ecuaciones  (3.18). 


Usando  técnicas  de  interpolación  de  funciones  vamos  a  construir  polinomios  con  la  pro¬ 
piedad  deseada.  Tenemos,  así,  el  siguiente  resultado. 


Proposición  3.15.  Para  cada  n  >  2  existe  un  polinomio  p  de  grado  menor  o  igual  que 
2 n  —  1,  tal  que  Np  tiene  un  n-ciclo. 


Demostración.  Consideremos  n  puntos  aq,  x2, . ■ . ,  xn  con  la  propiedad  que  x%  ^  Xj  si  i  ^  j 
para  todo  i,  j  £  { 1,2,...,  n}  y  sean  y1,  y2, . . . ,  yn  otros  n  puntos  con  la  propiedad  que  yk  ^  0 
para  todo  k  =  1,2, . . .  ,n  (nótese  que  los  puntos  yj  no  tienen  porqué  ser  necesariamente 
distintos).  Por  la  proposición  3.14,  si  /  :  M  — >  M  satisface  f{xf)  =  yt  para  i  =  1, . . . ,  n  y  las 
condiciones  (3.18),  entonces  el  conjunto  O  =  {xi,x2, . . .  ,xn}  es  un  n-ciclo  para  Nf. 

Para  construir  el  polinomio  p  usaremos  interpolación  de  Hcrmite,  que  sirve  para  determi¬ 
nar  un  polinomio  que  coincide  con  una  función  dada  y  con  su  derivada  primera  en  una  serie 
de  puntos  prefijados.  En  concreto,  buscamos  un  polinomio  p  de  grado  a  lo  más  2n  —  1  y  que 
satisface  las  condiciones 


í  f(xi)  =  yi ,  i  =  1,..., n, 


f(Xi)  = 


Vi 


Xj 


*£¿+1 


-,  i  -  l,...,/)  -  1,  y 


(3.19) 


f'{Xn) 


Un 

Xn  -  Xi  ' 


Aunque  existen  formas  de  escribir  el  polinomio  de  interpolación  de  Hermite  en  términos 
de  las  diferencias  divididas  de  la  función  a  interpolar  o  de  los  correspondientes  polinomios  de 
Lagrange  (véase  [50],  por  ejemplo),  en  esta  sección  emplearemos  una  formulación  alternativa 
para  representar  dicho  polinomio  interpolador.  Así,  escribimos  p  como 


p(x)  =  aipi(x)  +  a2p2(x)  H - b  a2np2n(x) 


(3.20) 
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donde  cada  pt  es  un  polinomio  de  grado  i  —  1,  para  2 n,  y  son  definidos  por 


Pl(x) 

=  1 

p2(x) 

=  pi(x)(x  —  Xi)  = 

p3(x) 

=  p2(x)(x  -  X 1)  = 

Pi{x) 

=  p3(x)(x-x  2)  = 

Pb{x) 

=  p±{x){x  -  x2)  = 

P2i—1  (x) 

=  P2i-2{x-Xi- 1) 

P2i(x) 

=  p2i-1(x)(x  -  Xi) 

P2n-l(x) 

=  P2n- 2{x){x-xn. 

P2n(x) 

=  p2n- i(x)(x-xn 

-  Xi) 

-x,)2 

-  Xi)2{x  -  x2) 

-  x1)2(x  -  x2)2 

(3.21) 


Notemos  qne  p2i-i(xi)  =  p2i-2(xi)(xi  -  £¿-i)  /  Oy  qne  =  í?2¿-i(a;¿)(x¿  -  x¿)  =  0,  esto 

nos  dice  que  Pj(xi)  ^  0  para  j  <  2i  —  1  y  que  Pj(xi )  =  0  para  j  >  2 i. 

Por  otra  parte,  tenemos  qne  p'2i{x )  =  p'2i_ i(x)(x  —  +  p2i- i(x),  de  donde  p2i(xi )  = 

P2i-i(xi)  0  y  P2í+i(x)  =  p2i(x)(x-Xi)+p2i(x),  así  p2i+1(xi)  =  p2i(xi )  =  0.  Luego,  7^  0 

para  j  <  2i  y  =  0  para  j  >  2¿  +  1.  Para  determinar  el  polinomio  p(x)  debemos  ser 

capaces  de  calcular  los  coeficientes  a¿,  para  i  =  1, . . . ,  2n.  Para  ello,  debemos  resolver  un 
sistema  de  2n  ecuaciones  con  2 n  incógnitas,  si  es  posible  hacerlo.  El  sistema  de  ecuaciones 
asociado  a  nuestro  problema  es  un  sistema  dado  por  una  matriz  A,  triangular  inferior,  cuyas 
filas  Aj,  para  j  =  1, ...  ,2 n  están  definidas  de  la  siguiente  manera. 


A2i- 1  =  (pi(xí)  p2(xi)  p3(xi)  •••  p2i-i(xi)  0  0  0  •••  0) 

Mi  =  (pi(®i)  P2(xí)  p'3(xí )  •••  P2¿_i(x¿)  p'2i(xi)  0  0  •••  0) 


con  i  —  1, ...  ,n. 

Así  el  sistema  de  ecuaciones  lineales  a  resolver  viene  dado  por  AX  =  b,  donde 


(  ) 

1  ai  ^ 

A  = 

,  X  = 

{  A  2n  ) 

^  &2n  / 

y  b  = 


Vi  \ 

yi 

X1—X2 


y n 

1  Vn 
\  x„-x 1 


(3.22) 


Este  sistema  tiene  solución,  pues  el  determinante  de  la  matriz  A  es  no  nulo.  Para  ello  basta 
notar  qne  la  matriz  A  es  triangular  inferior  y  que  las  componente  de  su  diagonal  son  los 
elementos  de  la  forma  p2i-i(xi)  y  p2i(xi),  los  cuales  son  no  nulos  para  i  =  l,...,n.  Esto 
completa  la  prueba  de  la  proposición.  □ 
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Ejemplo  3.7.  En  este  ejemplo  vamos  a  construir,  usando  la  técnica  desarrollada  en  la  pro¬ 
posición  3.15,  un  polinomio  cuyo  método  de  Newton  asociado  tenga  una  órbita  periódica  de 
período  3. 


Para  ello  consideremos  los  datos 


í  xx  =  0,  2/1  =  1, 

<  x2  =  1,  y2  =  -1, 
[  x3  =  2,  y3  =  1. 


Es  decir,  estamos  imponiendo  al  polinomio  p(x)  que  p(0)  =  1,  p(  1) 
p( 2)  =  1  y  que  sus  derivadas  en  esos  puntos  satisfagan 


P'( 0)  = 


=  -l,  p\  1)  = 


1-2 


=  1,  p\  2)  = 


2-0 


1 

2' 


-i  y 


Ahora  debemos  construir  los  polinomios  Pi(x),  i  =  1, . . . ,  6,  los  cuales  son  dados 
como  sigue: 


Pl(x) 

=  1 

p2(x) 

=  Pi(x)(x  —  Xi)  =  X 

PÁX) 

—  p2(x)(x  —  X 1)  =  X2 

Pi{x) 

—  p3(x)(x  —  x2)  =  x2(x 

Pb{x) 

=  Pi(x)(x  —  x2)  =  x2(x 

.  pe(x) 

—  p3(x)(x  —  x3)  =  x2(x 

1) 

l)2 

l)2{x  —  2). 


El  polinomio  buscado  tiene  la  forma 


p{x)  =  a±  +  a2x  +  03a;2  +  a±x2(x  —  1)  +  a$x2(x  —  l)2  +  aex2(x  —  l)2(a;  —  2). 


En  este  caso,  las  filas  de  la  matriz  A  del  sistema  de  ecuaciones  lineales  AX  =  b 


son: 

Ai  =  Pi(xi)  0  0  0  0  0 

A2  =  p'^xi)  p'2(x  1)  0  0  0  0 

A3  =  Pi(x2)  p2(x  2)  p3(x2)  0  0  0 

A\  =  P>i{x2)  P2{x2)  p3(x2)  p'4(x 2)  0  0 

A5  =  Pi(x3)  p2(x3)  p3(x 3)  ^4(^3)  P 5(^3)  0 

A  =  Pi(x3)'  p2(x3)  p'3(x3)  p'4(x3)  p'5(x3)  p'6(x3). 

Calculando  las  derivadas  de  los  polinomios  pi(x),  i  —  1, ...  ,6  y  evaluando  Pi{x)y 
p'i(x),  obtenemos  el  sistema  de  ecuaciones  lineales: 


(  1  0  0  0  0  0  \ 

*  ai  ^ 

0  1  0  0  0  0 

a2 

1110  0  0 

a3 

0  12  10  0 

04 

1  2  4  4  4  0 

a  5 

v  0  1  4  8  12  4  ) 

\  «6  / 

í  l\ 
-1 
-1 
1 
1 

V  \ ) 
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Figura  3.11:  Gráficas  del  polinomio  p(x )  definido  en  (3.23)  y  de  su  correspondiente  función 
de  iteración  para  el  método  de  Newton  Np(x). 


Figura  3.12:  Órbitas  de  los  puntos  xq  =  0  y  xq  =  0.0001  para  el  método  de  Newton  asociado 
al  polinomio  p(x )  definido  en  (3.23). 

cuya  solución  es  a\  —  1,  02  =  —1,  03  =  —1,  04  =  4,  <25  =  —5/2,  y  a§  =  7/8.  Por 
lo  tanto,  el  polinomio  buscado  es 

p(x )  =  1  —  x  —  x2  +  Ax2(x  —  1)  —  ^  x2{x  —  l)2  +  ^  x2{x  —  l)2(x  —  2).  (3.23) 

2  8 

En  las  figuras  3.11  y3. 12  se  muestran  los  gráficos  del  polinomio  p  construido,  del 
método  de  Newton  asociado,  Np,  con  el  3-ciclo  O  =  {0, 1,  2}.  También  se  muestra 
la  órbita  del  punto  x0  =  0.0001,  indicando  el  carácter  repulsor  del  3-ciclo  {0, 1,  2}. 

Ahora  veremos  como  obtener  a  partir  del  polinomio  p(x)  construido  en  la  proposición  3.15 
otro  polinomio  tal  que  el  n-ciclo  dado  por  la  proposción  sea  superatractor.  Pero  antes  de  eso 
veamos  como  caracterizamos  el  hecho  que  un  n-ciclo  sea  superatractor  para  el  método  de 
Newton. 

Proposición  3.16.  Sea  p(x)  un  polinomio  cuyo  método  de  Newton  tiene  un  n-ciclo,  O  = 
{xi,  x2,  •  •  • ,  xn}.  Si  p"{xi )  =  0  para  algún  i  G  {1,  2, ... ,  n},  entonces  O  es  superatractor. 
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Demostración.  Sin  pérdida  de  generalidad,  podemos  suponer  que  p"{x\)  =  0.  Como  Np(xí)  = 
x%+\  para  i  =  1, . . . ,  n  —  1  y  Np(xn)  =  xi,  aplicando  la  regla  de  la  cadena  se  tiene 

(N}y(x)  =  N^N^^N^N^ix))  ■  ■  ■  N'p(Np(x))N'p(x) . 

Tenemos  entonces 

(jyp'M  =  ■  ■  ■  n¿(x2)n;(x  ,). 

Como  Np(x)  =  p(x)p"  (x)  / p' (x)2  y  estamos  suponiendo  que  p"{x\)  =  0,  en  la  expresión  para 
(. Np)'(xi )  el  factor  N'{x i)  se  anula,  por  lo  tanto  (Np)\x i)  =  0,  y  el  resultado  está  probado. 

Ahora  tenemos  el  siguiente  resultado  que  nos  permite  construir  ciclos  atractores  para  el 
método  de  Newton.  □ 

Teorema  3.17.  Para  cada  n  >  2  existe  un  polinomio  p[x)  de  grado  menor  o  igual  a  2 n  de 
modo  que  Np(x)  tiene  un  n-ciclo  superatractor. 

Demostración.  Dado  un  conjunto  O  =  {aq, . . .  ,xn}  de  n  puntos  distintos  entre  sí,  y  dado 
otro  conjunto  de  n  puntos  {yi, . . .  ,yn},  usando  la  proposición  3.15  construimos  un  polinomio 
p(x)  tal  que  O  es  un  n-ciclo  para  Np(x).  El  polinomio  p(x)  tiene  la  forma  p(x)  =  aipi(x)  + 
•  •  •  +  ci2nP2n(x).  Definimos  un  nuevo  polinomio 

p(x)  =  p(x)  +  a2n+iP2n+i(x), 

donde  a2n+ 1  es  un  paramétro  a  determinar  y  p2n+1(x)  =  p2n(x)(x  —  xn).  Para  la  determinación 
de  a2n+i  imponemos  la  condición  de  que  el  n-ciclo  O  sea  superatractor  para  Np(x).  Notemos 
primero  que  la  nueva  condición  no  altera  O ,  ya  que  tenemos  p2n+\  (xt)  =  0  para  i  =  1, ...  ,  n. 
Como  queremos  que  O  sea  superatractora  para  Np(x),  por  la  proposición  3.16,  nos  basta 
encontrar  a2n+i  de  modo  que  p"{x i)  =  0,  imponiendo  esta  condición  y  resolviendo  para  a2n+i 
se  tiene  lo  pedido.  □ 

Ejemplo  3.8.  Como  continuación  del  ejemplo  3.1  vamos  a  construir  ahora  un  polinomio 
cuyo  método  de  Newton  asociado  tenga  una  órbita  periódica  de  período  3  que  además  sea 
superatractora. 
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Figura  3.13:  Gráficas  del  polinomio  p(x)  definido  en  (3.24)  y  de  su  correspondiente  función 
de  iteración  para  el  método  de  Newton  Np(x),  definida  en  (3.25). 
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Figura  3.14:  Órbitas  de  los  puntos  xo  =  0  y  xq  =  0.00003  para  el  método  de  Newton  asociado 
al  polinomio  p(x)  definido  en  (3.24). 


3.7.  Bifurcaciones  en  el  método  de  Newton 

En  lo  que  sigue  estudiaremos  la  aparición  de  bifurcaciones  en  la  función  de  iteración  del 
método  de  Newton  (3.2).  Esto  ocurre  cuando  la  función  /  pierde  una  raíz  pasando  a  través 
de  una  tangencia  cuadrática  con  el  eje  OX. 

En  lo  que  sigue,  supondremos  que  g  :  M  — >  M  es  una  función  dos  veces  derivadle  en  un 
entorno  del  origen,  que  cumple  las  siguientes  condiciones: 

s(0)  =  0,  </(0)  =  0,  /(0)>0.  (3.26) 

Para  /i  E  K,  definimos  ahora  /M(x)  =  g(x)  +  /j.  Localmente,  en  una  vecindad  de  0,  las 
funciones  ./),  tienen  unos  gráficos  como  los  que  se  muestran  en  la  figura  3.15. 

Denotemos  a  su  función  de  iteración  del  método  de  Newton  Nf  simplemente  por  N \l. 
Observemos  que  ./),  es  una  traslación  de  fi  unidades  en  la  dirección  del  eje  O  Y  de  la  función 
g.  Localmente,  las  gráficas  de  Ntl  tienen  la  apariencia  que  se  muestra  en  la  figura  3.16. 
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Figura  3.15:  Gráficos  de  las  funciones  /^(x)  =  g(x)  +  ¡jl  para  p  <  0,  /i  =  0y/i>0. 


Figura  3.16:  Gráfica  de  la  función  N M  para  /í<0,  /i  =  0y^>0. 
Obsérvese  que  /^(x)  =  c/(x).  Por  tanto, 


N^x)  =  x  - 


y  además 


Si  g'{x )  7^  0  entonces 


N'(x)  =  N'(x)  + 


d 


g{x)  +  d 
g'  (x) 

ng”{x) 


=  Ng(x)  - 


d 


(g'(x)y 


g'{x) 

(g(x)  +  g)g"(x) 
(g'(x))2 


(3.27) 


(3.28) 


anN^  = 


s'(aO' 


Nótese  que  esta  derivada  no  depende  del  parámetro  / i ,  y  está  bien  definida  cuando  </(x)  7^  0. 

d 

Por  otra  parte,  existen  puntos  excepcionales  (xo,  do)  donde  — iVM(x)  no  existe,  por  ejemplo, 

(y  jlX 

en  (x0,/io)  =  (0,/i).  Esos  puntos  corresponden  a  puntos  donde  </(x0)  =  0.  Note  que  las 
bandas  de  Nfl  son,  esencialmente,  independiente  de  g  y  son  las  mismas  que  para  Ng:  las 
únicas  excepciones  ocurren  en  los  valores  del  parámetro  /i  en  los  cuales  tiene  una  raíz  que 
es  también  un  punto  crítico,  es  decir,  para  (xo,/¿o)  tales  que  /Mo(xo)  =  0  y  /¿0(xo)  =  0,  es 
decir,  0  =  fIMi (x0)  =  5-(x0)  +  /x0  y  /¿0(^o)  =  ú'Op))  =  0,  o  más  específicamente 


g'(x0)  =  0, 
do  =  ~g(x  o). 
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Después  de  estas  consideraciones,  podemos  dar  el  siguiente  lema. 

Lema  3.18.  Sea  I  un  intervalo  compacto  sobre  el  cual  g'  no  se  anula,  entonces  cuando  n  — >  0 
se  tiene  que  N f  converge  a  Ng  y  N'  converge  a  N' ,  siendo  la  convergencia  en  ambos  casos 
uniforme. 


Demostración.  La  prueba  se  sigue  trivialmente  de  las  igualdades  (3.27)  y  (3.28).  □ 


Para  encontrar  puntos  periódicos  atractores  de  una  aplicación  1-dimensional  (real  o  com¬ 
pleja)  es  conveniente  seguir  la  órbitas  de  los  puntos  críticos  de  la  aplicación.  Para  nuestro 
caso,  existen  al  menos  dos  razones  para  esto:  primero  si  un  punto  crítico  de  Ng  es  periódico 
de  período  k,  entonces  su  órbita  es  superatractora;  segundo  si  Ng  es  una  función  racional  (co¬ 
ciente  de  dos  polinomios  sin  factores  comunes),  cosa  que  ocurre  para  Ng  por  ejemplo  cuando 
g  es  un  polinomio,  entonces  existe  una  fuerte  conexión  entre  las  órbitas  periódicas  atractoras 
y  los  puntos  críticos  de  la  función  de  iteración  del  método  de  Newton.  De  hecho,  en  general, 
el  teorema  de  Julia  ([16,  p.  194])  establece  que  cada  órbita  periódica  atractora  de  una  función 
racional  arbitraria  contiene  un  punto  crítico  en  su  cuenca  de  atracción  inmediata. 

En  lo  que  sigue  estudiaremos  las  órbitas  de  los  puntos  críticos  de  Ng  cuando  el  gráfico 
de  i],  pasa  a  través  de  una  tangencia  cuadrática  con  el  eje  OX  en  el  punto  (x,g)  =  (0,0). 
Asumiremos  que  tal  punto  crítico  existe.  Tenemos  que 


(/»)2 


luego  los  puntos  críticos  de  N caso  fg(x)  ^  o,  son  los  puntos  donde  fg(x)  =  0  (raíces  de  /),) 

o  f”{x)  =  0  (puntos  de  inflexión  de  /).  Cuando  un  punto  crítico  de  Ng  no  es  una  raíz  de 

ffi(x)  =  0  diremos  que  es  punto  crítico  libre.  Como  /"  =  g"  se  tiene  que  los  puntos  críticos 

libres  de  Ng  son  aquellos  donde  g"  se  anula,  es  decir,  genéricamente,  un  punto  de  inflexión 

de  g.  Como  g"(x)  >  0  en  una  vecindad  de  x  =  0,  la  condición  de  existencia  de  un  punto  crítico 

libre  se  puede  formular  de  la  siguiente  forma:  existen  puntos  p  <  0  <  q  tales  que  g"(p)  =  0 

y  g"(x)  >  0  sobre  (p,  q).  Esto  junto  con  la  condición  que  impusimos  a  g,  es  decir,  p(0)  =  0, 

g'(0)  =  0,  g"( 0)  >  0,  y  el  teorema  del  valor  medio  implican  que  el  único  punto  sobre  (p,  q) 

donde  o  bien  g  o  g'  se  anulan  es  x  =  0,  g(x)  >  0  sobre  (p,  q ),  g\x)  <  0  sobre  (p,  0)  y  g\x)  >  0 

f  ¡JLQ,r  (oc) 

sobre  (0,g).  Ahora,  como  N'g(x)  =  Ng(x)  H - ;  se  tiene  que  Ng(x)  >  Ng(x)  >  0  sobre 


g'  (x) 
d 


(p,  q )  —  {0}  y  /i  >  0.  Por  otra  parte,  dado  que  —Ng(x)  = 
d 


1  d 

se  sigue  que  —Ng(x)  >  0 


sobre  (p,  0)  y  —Ng(x)  <  0  sobre  (0,g).  Tenemos  el  siguiente  lema. 

Lema  3.19.  Supongamos  que  ¡i  >  0.  Si  NDp)  <  0  para  0  <  i  <  k  entonces 
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Demostración.  Por  la  regla  de  la  cadena,  tenemos  que 

Ahora  como  A/(p)  <  0  para  0  <  i  <  k  se  tiene  que 

Y^ánM)  >  o. 

Por  lo  tanto, 

|A(p)  =  n|wto)>o, 

como  deseábamos  probar.  □ 

Las  hipótesis  del  lema  anterior  se  satisfacen  para  valores  pequeños  de  fi.  Además  por  la 
continuidad  respecto  a  (i  podemos  enunciar  el  siguiente  resultado. 

Lema  3.20.  Dado  k  >  0  existe  >  0  tal  que  si  \p\  >  p0  entonces  p  <  A/¿ (p)  <  A^(p)  < 

•••  <  n¡¡(p)  <  o. 

Demostración.  Como  N'  (x)  >  0  sobre  (p,  g)  —  {0}  (A'(0)  =  1/2)  se  sigue  que  Ng  es  monótona 
creciente  sobre  [p,  q],  y  para  cualquier  x  G  [p,  q ],  Ng(x)  está  entre  jyO  luego,  para  cualquier 
x  G  \p,q\  la  sucesión  Ng(x)  converge  monótonamente  a  0.  Además,  para  cualquier  constante 
positiva  f3,  se  tiene  que  N ^  converge  C 1  uniformemente  a  Ng  sobre  [p,  —/3\  U  [/?,  q\  cuando 
pL  — >  0,  así  si  elegimos  (3  <  mín{N^(q),  (p)  \ }  encontramos  p0  como  asegura  el  lema.  □ 

Lema  3.21.  Dado  k  >  0  existe  pi  >  0  tal  que  si  0  <  p  <  /ii  entonces 

(1)  p  <  iVM(p)  <  •  •  •  <  Aj-^p)  <  0; 

(2)  Nj¡(p)  >  N*~\p); 

(3)  AA~ 1  (p)  0  cuando  p  /*  pi,  luego,  Nj¡(p)  — >  oo  cuando  ¡i  /* 

Demostración.  Es  una  consecuencia  inmediata  de  las  condiciones  y  de  los  lemas  anteriores. 
La  idea  es  que  si  la  condición  (1)  vale,  el  conjunto  (iV*(p)}  es  monótono  en  i  para  0  <  i  <  k 
y  en  p  para  p  >  0. 

Por  los  dos  últimos  lemas,  para  cada  k  >  1  existe  un  /i-intervalo  [afc,  bk\  tal  que  si  p  G 
[ak,bk\  entonces 

'  A*  (p)  G  (p,  0),  1  <  i  <  k, 

N^(p)e[0,q], 

Nak(P )  =  0, 

,  NbkiP)  =  Q- 
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Figura  3.17:  Gráficas  de  las  curvas  Z  y  jk  que  aparecen  en  la  demostración  del  lema  3.21. 

Además,  para  cada  k  se  tiene  que  a k  >  áfc+i  >  0  y  lím^oo  a*,  =  0.  Definamos  la  aplicación 
jk  :  [akjbk\  — >  [Q,q]  por  jk(p)  =  A l¡¡(p).  Cada  aplicación  jk  es  monótona  creciente  y  aplica 
[cik,bk]  sobre  [0 ,q\. 

Para  valores  pequeños  y  positivos  de  /i,  se  tiene  que  iVM  aplica  el  intervalo  [0,g]  sobre  el 
intervalo  [p,  0];  luego  el  conjunto  N~ 1  (p)  f|  (0,  q)  es  no  vacío.  Por  el  teorema  de  la  función 
implícita  se  tiene  que  el  conjunto  N~l{p)  fi  (0 ,q)  es  el  gráfico  de  una  función  creciente  x  = 
Z(p).  Las  curvas  Z  y  jk  se  muestran  en  la  figura  3.17. 

Para  todo  k  grande  existe  un  punto  (gk,xk)  satisfaciendo 

\  xk  =  Z{nk) 

xk  Jfe(Pfc)- 

Consecuentemente,  para  p  =  pk  el  punto  crítico  p  de  está  sobre  una  órbita  periódica 
superatractora  de  período  k  +  1  para  Nfl.  Tenemos  xk  =  Z(gk)  —  N~¿(p)  D  (0,  q),  de  donde 
N^Áxk)  =  M  n  Nw((0,  q))  y  Xk  =  jk(dk)-  Luego,  p  =  NM(xk)  =  Aj+^p),  y  como  g'\p)  =  0 
se  tiene  que  (Njj+1)'(p)  =  0.  □ 

Tenemos  el  siguiente  teorema. 

Teorema  3.22.  Supongamos  que  g  es  de  clase  al  menos  C3(I )  donde  I  es  un  intervalo  que 
contiene  al  0  y  además  se  satisfacen  las  siguientes  condiciones:  g( 0)  =  0,  g'{0)  =  0,  g"( 0)  ^ 

0. 

Sea  ffj,(x)  —  g{x)  +  p.  Si  existe  un  punto  p  con  g"(p)  =  0  entonces  para  todo  k  suficien¬ 
temente  grande,  existe  un  intervalo  abierto  Ik  sobre  el  g-eje  tal  que 

(1)  Para  cada  p  £  h,  Ia  aplicación  de  Newton  tiene  una  órbita  periódica  atractora  de 
período  k; 
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(2)  cada  intervalo  R  contiene  al  menos  un  punto  Hk  tal  (l'ue  p  es  un  punto  periódico  super- 
atractor  de  Nfl  para  p  =  pk¡ 

(3)  si  Iu  =  (I/fe,  Rk)  entonces  Lk  y  Rk  tienden  a  O  cuando  k  — >  oo. 

Demostración.  En  lo  anterior  hemos  tratado  el  caso  p  <  0  y  g"(p)  >  0.  En  esa  condiciones 
hemos  demostrado  la  existencia  de  una  órbita  periódica  superatractora  para  p  =  pk ■  El 
teorema  de  la  función  implícita  muestra  que  esa  órbita  continua  existiendo  para  todos  los 
valores  de  p  suficientemente  cercanos  a  pk ■  Sea  R  un  intervalo  que  contiene  a  pk  y  tal  que 
para  cada  p  G  R,  tiene  una  órbita  periódica  atractora  de  período  k  que  contiene  a  p 
en  su  cuenca  de  atracción.  Si  p  >  0  el  argumento  es  esencialmente  el  mismo.  Para  el  caso 
g"{R)  <  0,  notemos  que  la  aplicación  de  Newton  N ^  de  g  +  p  es  exactamente  la  misma  que 
para  —g  —  p  la  cual  le  podemos  aplicar  el  argumento  anterior.  Esto  completa  la  prueba  del 
teorema.  □ 

Para  ilustrar  lo  discutido  anteriormente  el  lector  puede  considerar  el  ejemplo  siguiente. 
Sea  f(x)  =  x3  —  3x  +  p.  Esta  familia  de  aplicaciones  tiene  una  tangencia  cuadrática  con  el  eje 
x  en  x  —  1  cuando  p  —  2.  Tenemos  f^{x)  =  3a;2  —  3,  =  6x.  Luego  el  único  cero  de  /"  es 

x  =  0.  Por  lo  tanto,  del  teorema  de  Julia  Ntl  si  tiene  una  órbita  periódica  de  período  mayor 
que  1,  entonces  los  iterados  de  0  deben  tender  a  esa  órbita.  Un  pequeño  experimento  (véase 
el  cuadro  3.1),  nos  permite  calcular  los  valores  del  parámetro  pk  para  los  cuales  la  función 
de  iteración  N ^  definida  en  (3.27)  tiene  un  ciclo  de  período  k. 

Cuadro  3.1:  Ciclos  periódicos  y  valores  del  parámetro  pk  para  la  función  Ar/¿  definida  en  (3.27). 


Período  k 

Parámetro  pk 

2 

3.674234614 

3 

7.7513408204 

4 

15.556213393 

5 

30.155532349 

Capítulo  4 

Dinámica  del  método  de  Newton  en  el 
plano  complejo 

4.1.  Antecedentes:  el  problema  de  Cayley 

El  estudio  de  la  dinámica  del  método  de  Newton  en  el  campo  complejo  tiene  una  impor¬ 
tancia  histórica,  desde  que  E.  Schróder  (1870)  y  A.  Cayley  (1879)  propusieran  usar  el  método 
de  Newton  para  resolver  ecuaciones  definidas  en  el  plano  complejo: 

/(*)  =  0,  /:C-C.  (4.1) 

El  que  se  conoce  como  problema  de  Cayley  consiste  en  estudiar  las  cuencas  de  atracción 
del  método  de  Newton  cuando  es  aplicado  para  aproximar  las  raíces  del  polinomio  complejo 
p(z).  En  palabras  del  propio  Cayley,  el  problema  se  puede  formular  como  sigue: 

«...the  problem  is  to  determine  the  regions  of  the  plañe,  such  that  P  [initial 
point]  being  taken  at  pleasure  anywhere  within  one  región  we  arrive  ultimately 
at  the  point  A  [a  root  of  the  polynomial] ...» 

Con  la  notación  actual,  si  z*  es  una  solución  de  (4.1),  y 

_  ^  _  f(zn ) 

/'(*„)  (  ’ 

es  la  sucesión  generada  por  el  método  de  Newton  a  partir  de  un  cierto  zo  €  C,  se  trata  de 
caracterizar  la  región 

A{z*)  =  {^o  G  C  :  zn  ->  z*}, 

conocida  como  cuenca  de  atracción  de  la  raíz  z*.  Cayley  ([28],  [29])  consiguió  caracterizar 
los  cuencas  de  atracción  de  las  raíces  de  un  polinomio  cuadrático,  en  concreto  del  polinomio 
p(z)  =  z2  —  1,  aunque  fracasó  en  su  intento  de  extender  el  estudio  al  caso  cúbico  y  a  grados 
superiores.  Después  de  un  tiempo  tratando  de  resolver  el  problema  para  el  polinomio  cúbico 
p(z)  —  z3  —  1,  escribe  en  [30]  la  siguiente  sentencia: 
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«J’espére  appliquer  cette  théorie  au  cas  d’une  équation  cubique,  mais  les  calculs 
sont  beaucoup  plus  difficiles» 


En  la  figura  4.1  mostramos  las  cuencas  de  atracción  de  los  polinomios  p(z)  =  z2  —  1  y 
p(z)  =  z3  —  1.  En  el  primer  caso  vemos  que  los  puntos  de  partida  situados  en  el  semiplano 
C"  =  {z  G  C  :  Re(z)  <  0}  convergen  a  la  raíz  z*  =  —1,  mientras  que  los  puntos  de  partida 
situados  en  el  semiplano  C+  =  {z  G  C  :  Re(z)  >  0}  convergen  a  la  raíz  z*  =  1.  En  la 
separación  de  ambas  regiones,  el  eje  imaginario,  en  donde  el  método  de  Newton  presenta  un 
comportamiento  caótico.  Sin  embargo,  como  vemos  en  la  segunda  gráfica  de  la  figura  4.1,  la 
situación  para  el  polinomio  p(z)  =  z3  —  1  es  mucho  más  complicada.  La  separación  entre  las 
cuencas  de  atracción  de  las  tres  raíces,  1,  (—1  +  a/3z) / 2  y  (—1  —  \/3i)/2 ,  no  es  tan  diáfana  y 
tiene  una  estructura  mucho  más  enrevesada. 


Figura  4.1:  A  la  izquierda  se  muestran  las  cuencas  de  atracción  del  polinomio  p(z)  =  z2  —  1  y 
a  la  derecha  las  del  polinomio  p{z)  =  z3  —  1.  Las  regiones  pintadas  con  el  mismo  color  están 
formadas  por  puntos  de  partida  para  los  cuales  el  método  de  Newton  converge  a  la  misma 
raíz  del  polinomio  correspondiente. 


No  es  de  extrañar,  por  tanto,  que  Cayley,  que  no  disponía  de  los  potentes  programas  de 
dibujo  y  cálculo  simbólico  que  tenemos  en  la  actualidad,  encontrara  dificultades  al  intentar 
pasar  de  una  ecuación  cuadrática  a  una  cúbica. 

Posteriormente,  G.  Julia  y  P.  Fatou  consideran  funciones  racionales  en  una  forma  más 
general,  obteniendo  resultados  significativos  y  sientan  el  estudio  de  iteraciones  de  funciones 
racionales  en  el  plano  complejo  extendido,  también  conocido  como  la  esfera  de  Riemann. 
En  otras  palabras,  con  sus  trabajos  comienza  en  forma  sistemática  el  estudio  de  los  sistemas 
dinámicos  complejos.  La  base  de  sus  trabajos  fue  el  estudio  realizado  por  Montel  sobre  familias 
normales. 


4.2.  Conceptos  básicos  de  dinámica  compleja 
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En  esta  sección  revisamos  algunos  conceptos  básicos  de  dinámica  compleja  que  serán 
necesarios  para  el  análisis  del  método  de  Newton  cuando  se  aplica  a  funciones  definidas  en 
el  plano  complejo.  En  especial,  haremos  hincapié  en  el  caso  de  la  aplicación  del  método  de 
Newton  a  ecuaciones  polinómicas. 

En  primer  lugar,  notemos  que  dado  un  polinomio  definido  en  el  plano  complejo  p  :  C  — >  C, 
la  función  de  iteración  del  método  de  Newton 


Np(z) 


P(z) 

p'(z) 


zp'(z)  —  p(z) 

p'O) 


(4.3) 


puede  considerarse  como  una  función  racional  definida  sobre  la  esfera  de  Riemann  C  = 
C  U  {oo}. 


Definición  4.1.  Una  función  racional  R  :  C  — >  C  es  una  función  de  la  forma 

R «  -  wy  <4-4> 

donde  P  y  Q  son  polinomios  coprimos  (sin  factores  comunes). 

El  grado  de  una  aplicación  racional  R(z)  =  P(z)/Q(z)  está  definido  como 


grado(-ñ)  =  máx{grado(P),  grado(Q)}. 


(4.5) 


La  n-ésima  iteración  Rn  de  una  función  racional  R  se  define  recursivamente  a  partir  de 
las  relaciones  R2  =  R  o  R  y  Rn  =  Rn  l  o  R.  Nótese  que  grado(i?")  =  (grado(i?))n  para 
grado  (i?)  >  1. 

Las  funciones  racionales  pueden  interpretarse  como  las  funciones  analíticas  de  la  esfera  de 
Riemann  C  en  sí  misma.  Informalmente,  el  grado  indica  cuántas  veces  1a.  aplicación  R  «enro¬ 
lla»  la  esfera  alrededor  de  sí  misma,  y  éste  es  igual  a.1  número  (contado  con  multiplicidades) 
de  preimágenes  de  un  punto  arbitrario. 

El  estudio  de  1a.  dinámica  de  una  función  racional  R  trata  de  analizar  el  comportamiento 
de  las  órbitas  de  un  punto  z0  G  C 


orb¿(z0)  =  {zq,  z1  =  R(zo),  z2  =  R(z i)  =  R2(z0),  ...,zn  =  Rn(z0), . . .}. 

Existen  varias  preguntas  que  podemos  hacernos  sobre  una  órbita  dada  orb¿(^0)-  Por 
ejemplo,  ¿cuáles  son  los  puntos  límites  de  orb¿(z0)?,  o  en  otras  palabras,  ¿dónde  se  acumulan 
los  iterados  de  un  punto  z0  por  una  función  racional? 

En  la  situación  ideal,  cuando  la  función  racional  que  estamos  estudiando  es  obtenida  al 
aplicar  un  método  iterativo  para  aproximar  los  ceros  de  un  polinomio  complejo,  los  puntos 
donde  se  aproximan  los  iterados  de  un  punto  arbitrario  por  1a.  función  de  iteración  en  estudio 
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deberían  corresponder  a  los  ceros  del  polinomio  en  cuestión.  Lamentablemente  como  veremos 
esto  no  siempre  ocurre,  pueden  existir  regiones  de  área  positiva  en  el  plano  complejo,  de 
modo  que  si  elegimos  una  condición  inicial  en  esas  regiones,  las  iteraciones  de  esos  punto  no 
convergen  a  un  cero  del  polinomio.  Por  otra  parte,  si  existen  dichas  regiones  nos  podemos 
preguntar  ¿qué  tipo  de  conducta  puede  aparecer  en  este  caso?  ¿cuáles  son  las  propiedades 
topológicas  y  analíticas  del  conjunto  de  puntos  límites  de  orb¿(zo)? 

Para  poder  responder  a  estos  interrogantes  sobre  el  estudio  dinámico  de  una  función 
racional  hay  que  analizar  el  comportamiento  de  algunos  puntos  especialmente  relevantes, 
como  son  los  puntos  fijos,  los  ciclos  y  los  puntos  críticos. 

4.2.1.  Puntos  fijos  de  una  aplicación  racional 

Al  igual  que  se  vio  para  funciones  de  variable  real,  los  puntos  fijos  de  una  función  de 
variable  compleja  f(z)  son  las  soluciones  de  la  ecuación  f(z)  =  z.  Además,  el  infinito  también 
puede  ser  considerado  un  punto  fijo  en  C.  Para  el  caso  particular  de  una  función  racional 
R(z)  =  P(z)/Q(z),  oo  es  un  punto  fijo  si  y  sólo  si  grado(P)  >  grado(Q).  El  resto  de  puntos 
fijos  son  las  soluciones  de  P(z)  —  zQ(z )  =  0. 

La  clasificación  de  los  puntos  fijos  de  una  función  de  variable  compleja  es  similar  a  la 
vista  para  funciones  de  variable  real.  En  concreto,  si  zq  es  un  punto  fijo  de  una  función  R(z) 
con  multiplicador  asociado  A  =  R'(z0),  entonces  z0  es  superatraetor  si  A  =  0,  atractor  si 
0  <  | A |  <  1 ,  indiferente  si  |A|  =  1  y  repulsor  si  |A|  >  1.  Además,  en  el  caso  de  las  funciones 
de  variable  compleja,  los  puntos  fijos  indiferentes  se  clasifican  en: 

1.  Racionalmente  indiferentes  o  parabólicos  si  A  es  una  raíz  de  la  unidad,  esto  significa, 
que  existe  un  número  natural  n,  tal  que  \n  =  1,  es  decir,  A  es  de  la  forma  A  =  e2md  con 
9  racional. 

2.  Irracionalmente  indiferentes  en  otro  caso,  es  decir,  A  =  e2me  con  6  irracional. 

Respecto  a  la  cantidad  de  puntos  fijos  que  puede  poseer  una  función  racional,  tenemos  el 
siguiente  resultado,  cuya  demostración  es  consecuencia  directa  del  teorema  fundamental  del 
álgebra. 

Teorema  4.1.  Una  función  racional  de  grado  d  >  1  tiene  exactamente  d  +  1  puntos  fijos 
contados  con  sus  multiplicidades. 

En  este  resultado  hemos  utilizado  el  concepto  de  multiplicidad  de  un  punto  fijo  de  una 
función  racional,  que  enunciamos  a  continuación. 

Definición  4.2.  Sea  r  G  C  un  punto  fijo  de  una  función  racional  R.  Decimos  que  r  tiene 
multiplicidad  m  >  1  si,  r  es  una  raíz  de  multiplicidad  m  de  la  ecuación  F(z)  =  R(z)  —  z  =  0, 
esto  es,  F^\r)  =  0  para  j  —  0, . . .  ,  m  —  1  y  F^m\r)  ^  0.  En  el  caso  m  =  1,  decimos  que  r 
es  un  cero  simple  de  R,  es  decir,  F(r)  =  0  y  F'(r)  ^  0. 
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Como  el  punto  del  infinito  es  un  punto  de  la  esfera  de  Riemann,  merece  la  pena  comentar 
qué  se  entiende  por  su  multiplicidad.  Notemos,  en  primer  lugar  que  la  transformación  de 
Móbius  m(z)  =  1  /z,  aplica  z  =  oo  en  z  =  0  y  viceversa.  Definimos 


S(z)  —  moRom  1(z),  m(z) 


1 

z 


(4.6) 


Entonces  5'(0)  =  l/i2(oo).  Por  lo  tanto,  z  =  oo  es  un  punto  fijo  de  R  si  z  =  0  lo  es  de  S,  es 
decir,  5'(0)  =  0.  Además  su  carácter  atractor  o  repulsor  vendrá  determinado  por  el  valor 


S\ 0)  =  lím  S'(z). 

z^O 

Definición  4.3.  La  multiplicidad  del  punto  del  infinito  z  =  oo  como  punto  fijo  de  una  función 
racional  R  se  define  como  la  multiplicidad  del  punto  z  =  0  como  punto  fijo  de  la  función  S 
definida  en  (f.6). 


Respecto  de  la  carácter  del  punto  z  =  oo  como  punto  fijo  de  una  función  racional  R  = 
P/Q,  tenemos  el  siguiente  resultado. 

Teorema  4.2.  Supongamos  que 

.  .  anzn  +  an-\zn  1  +  •  •  •  +  cío 

Rlz)  =  - - - - , - — 

bmzm  +  bm-íZ™-1  +  •  •  •  +  b0 

es  una  función  racional  con  n  >  m.  Entonces  z  =  oo  es  un  punto  fijo  de  R  con  el  siguiente 
comportamiento: 


1.  Superatractor  si  m  <  n  —  1 . 

2.  Atractor  si  m  <  n  —  1  y  \an\  >  \bm\. 

3.  Repulsor  si  m  —  n  —  1  y  \an\  >  \bm\. 

4.  Indiferente  si  m  =  n  —  1  y  \an\  =  \bm\. 

Como  ya  hemos  comentado  en  otras  situaciones,  si  aplicamos  el  método  de  Newton  a  una 
ecuación  no  lineal  f(z)  =  0,  resulta  que  los  ceros  de  /  son  puntos  fijos  de  Nf  y  recíprocamente. 
Si  1a,  función  f(z)  es  un  polinomio  de  grado  d  >  2  con  todas  sus  raíces  simples,  entonces  los 

d  +  1  puntos  fijos  de  la  función  de  iteración  N¡  son  precisamente  estas  d  raíces  junto  con  el 

punto  del  infinito  z  =  00.  El  caso  de  un  polinomio  general,  se  analiza  en  el  siguiente  ejemplo. 

Ejemplo  4.1.  Analícense  los  puntos  fijos  y  su  multiplicidad  de  la  función  de  iteración  del 
método  de  Newton  aplicado  a  un  polinomio  de  grado  d  >  2. 
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Consideremos  un  polinomio  de  la  forma 

n 

f(z)  =  m*  -  mi  d - émn  =  d,  oii  otj ,  si  i  3-  (4-7) 

Í=  1 

Entonces 

n 

log  f(z)  =  J2  rn>  los(^  “  «*)• 

i=  1 

Derivando  la  expresión  anterior, 

f'{z)  =  A  mt 

f(z)  h\z~ai 

se  llega  a  que  la  función  de  iteración  del  método  de  Newton  para  funciones  de  la 
forma  (4.7)  es 

n 

z^m¿n¿(z)  -n(z) 

Nf(z)  =  z  -  n  ^  ¡ - ,  (4.8) 

miUi(z) 

Í=  1  2—1 

donde  hemos  definido  los  siguientes  polinomios 

n  n 

n(*)  =  Y[(z-ai),  Yli(z)  =  Hiz-aj). 

i= 1  J=1 

Obsérvese  que  el  denominador  de  la  función  racional  Nf(z)  definida  en  (4.8)  es 
un  polinomio  de  grado  n—  1,  mientras  que  el  numerador  es  un  polinomio  de  grado 
n  cuyo  coeficiente  director  es  mi  +  •  ■  ■  +  mn  —  1  =  d  —  1^0.  En  consecuencia, 
la  función  de  iteración  del  método  de  Newton  tiene  n  +  1  puntos  fijos  que  son 
precisamente  las  n  raíces  distintas  del  polinomio  (4.7)  junto  con  el  punto  del 
infinito  z  —  oo. 

Por  último,  nótese  que  el  grado  de  la  función  de  iteración  del  método  de  Newton 
Nf  coincide  con  el  grado  del  polinomio  si  todas  las  raíces  son  simples.  Pero  si 
aparece  alguna  raíz  múltiple,  entonces  la  función  racional  correspondiente  Nf 
tiene  grado  menor  que  d.  En  concreto  el  grado  de  Nf  es  ahora  el  número  n  de 
raíces  diferentes  del  polinomio  (4.7). 

Ejemplo  4.2.  z  =  oo  es  un  punto  fijo  repulsor  para  el  método  de  Newton  aplicado  a  un 
polinomio. 

Si  p(z)  es  un  polinomio  de  grado  d,  es  una  comprobación  inmediata  que  Np( oo)  = 
oo.  Además,  como 

NM  =  TZi>1’ 


se  trata  de  un  punto  fijo  repulsor. 
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En  los  ejemplos  anteriores  se  ha  puesto  de  manifiesto  que,  para  ecuaciones  polinómicas, 
la  función  racional  asociada  al  método  de  Newton  tiene  el  número  máximo  de  puntos  fijos 
que  establece  el  teorema  4.1  y  que  estos  puntos  fijos  son  precisamente  las  raíces  distintas 
del  polinomio  en  cuestión,  junto  con  el  punto  del  infinito.  Sin  embargo,  esta  propiedad  no  es 
extensible  a  métodos  iterativos  para  resolver  ecuaciones  no  lineales.  En  ocasiones,  al  aplicar 
algún  método  iterativo,  digamos  M,  a  una  función  /,  la  función  de  iteración  obtenida,  M ¡ , 
puede  tener  puntos  fijos  distintos  de  los  ceros  de  /.  A  estos  puntos  fijos  los  llamaremos 
puntos  fijos  extraños.  Los  siguientes  ejemplos  muestran  la  aparición  de  puntos  fijos  extraños 
en  algunos  procesos  iterativos  conocidos. 

Ejemplo  4.3.  La  función  de  iteración  asociada  al  método  del  punto  medio  introduce  puntos 
fijos  extraños. 


El  conocido  como  método  del  punto  medio  para  resolver  ecuaciones  no  lineales 
tiene  la  siguiente  expresión  (véase  [146]): 


M’(z)  =  *  - 

Cuando  aplicamos  (4.9)  al  polinomio  p(z) 
iteración  racional 


/(*) 


(4.9) 


f(z)/(2f>(z))y 
=  z3  —  1,  obtenemos  la  función  de 


que  tiene  a  z 


Mp(z)  = 


z(13z6  +  22¿3  +  1) 


(5z3  +  l)2 

0  como  punto  fijo  que  no  corresponde  con  ninguna  raíz  de  p(z). 


Además,  si  r  es  un  cero  simple  de  p,  es  decir,  p{r)  =  0  y  p'(r)  y  0,  entonces 
M'{r)  =  0  y  r  es  un  punto  fijo  super atractor.  De  hecho  se  puede  ver  que  también 
M"(r)  =  0  y  M"'(r)  ^  0  por  lo  que  la  convergencia  del  método  en  un  entorno  de 
estos  puntos  es  cúbica.  Sin  embargo,  para  el  punto  fijo  extraño,  z  —  0,  tenemos 
que  M'{ 0)  =  1  y,  por  tanto,  éste  es  un  punto  fijo  racionalmente  indiferente. 


Ejemplo  4.4.  La  función  de  iteración  asociada  al  método  de  Chebyshev  (2.8)  introduce 
puntos  fijos  extraños. 


La  expresión  del  método  de  Chebyshev  para  resolver  ecuaciones  no  lineales  es  la 
siguiente  (véase  [146]): 

Ch  M  „  (1  ,  LÁZ )\  f(z )  t  M  _  /(-)/"(-) 

Ch,(z)  +  /W  “  7W5" 

Si  aplicamos  este  método  al  polinomio  p(z)  =  2z3  +  z2  +  z  —  1  obtenemos  la 
función  de  iteración 

,  /  \  230  +  40z  +  75z2  +  54z3  +  104z4  +  12CD5 

Chp(z )  =  z2 - 


(1  +  2¿  +  6^2)3 
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que  contiene  a  z  =  0  como  punto  fijo  aunque  no  es  ninguna  raíz  de  p.  Además  del 
z  =  0,  aparecen  otros  tres  puntos  fijos  extraños,  que  son  las  raíces  del  polinomio 
-1  +  23z  +  32z2  +  48z3. 


Supongamos  que  se  aplica  un  método  numérico  concreto  para  encontrar  las  raíces  de  un 
polinomio  p(z)  de  grado  d  >  2,  obteniéndose  una  función  de  iteración  racional  que  denotamos 
Mp.  En  el  peor  de  los  casos,  si  Mp  tiene  grado  k(d),  entonces  podrían  aparecer  k(d)  —d  puntos 
fijos  extraños. 

Respecto  al  problema  de  aproximar  las  raíces  de  una  ecuación  por  un  proceso  iterativo,  la 
aparición  de  puntos  fijos  extraños  no  sería  problemática  si  éstos  son  repnlsores.  Ahora  bien,  si 
un  punto  fijo  extraño  es  atractor,  esto  daría  lugar  a  la  existencia  de  conjuntos  U,  de  medida 
positiva,  de  forma  que  si  zq  G  U,  el  correspondiente  método  numérico  empezando  en  zq  no 
converge  a  ninguna  solución  de  la  ecuación  considerada. 

Vamos  a  estudiar  ahora  la  dinámica  asociada  a  los  puntos  fijos  indiferentes.  Comenzamos 
por  el  caso 

R{z)  =  z-  zm+1 +  0(zm+2),  m  >  1,  (4.10) 

es  decir,  z  =  0  es  un  punto  fijo  de  multiplicidad  m  +  1.  Además,  se  trata  de  un  punto  fijo 
indiferente  pues  M)( 0)  =  1. 

El  siguiente  resultado  describe  las  cuencas  de  atracción  en  este  caso. 


Teorema  4.3  (de  los  pétalos).  Sea  R  una  función  racional  que  tiene  en  £  =  0  un  punto  fijo 
racionalmente  indiferente  como  en  (filO).  Sean  cui, . . .  ,cum  las  raíces  m-ésimas  de  la  unidad 
y  sean  rji, . . .  ,rjm  las  raíces  m-ésimas  de  —  1.  Entonces  existe  un  radio  r0  y  un  ángulo  90,  tal 
que  para  j  =  1, . . . ,  m,  los  sectores  Sj  y  E j,  definidos  por 


V 

satisfacen 


S¿  =  <  z  :  0  < 


CU; 


<  ro, 


arg 


CU; 


<  9n 


E;  =  <  z  :  0  < 


<  r0, 


arg 


filj, 


<  9n 


|f?(^)|  <|^|,  para  todo  z  G  Sj, 


y 


\R(z)\  >  \z\, 


para  todo  z  G  E¿. 


Teorema  4.4.  Sea  R  una  función  racional  como  en  el  teorema  f.3.  Para  un  t  >  0  dado  y 
para  cada  k  —  0, _ ,  m  —  1,  definimos  los  pétalos 


n  k(t) 


:  r  <  t(  1  +  eos (m6)), 


2kn 

m 


(4.11) 


Entonces,  para  t  suficientemente  pequeño,  R  aplica  cada  pétalo  en  si  mismo.  Además,  para 
cada  z  G  !!*,(£),  los  iterados  de  z  por  R  convergen  a  0. 
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Se  puede  dar  una  prueba  análoga  a  estos  resultados  para  el  caso 

R(z)  =  z-azm+1  +  0(zm+),  fl^OymM,  (4.12) 

con  o^l.  Para  más  información,  véanse  por  ejemplo  [16],  [26],  [73],  [102]  o  [103]. 


4.2.2.  Ciclos  en  una  función  racional 

Otro  de  los  fenómenos  más  frecuentes  en  el  estudio  dinámico  de  una  función  racional  es  la 
aparición  de  ciclos.  Para  el  caso  de  funciones  de  variable  compleja,  la  definición  y  propiedades 
básicas  de  los  ciclos  son  meras  generalizaciones  de  lo  que  se  vio  en  el  capítulo  1  para  funciones 
reales. 

En  el  caso  de  funciones  racionales  asociadas  a  funciones  de  iteración,  aparte  de  tener 
puntos  fijos  extraños,  pueden  tener  ciclos  de  período  mayor  que  1.  Es  obvio  que  la  órbita 
de  un  punto  inicial  que  está  en  un  ciclo  no  convergerá  a  un  cero  de  la  función  asociada  a  la 
función  de  iteración. 

Ejemplo  4.5  (Smale,  [139]).  El  método  de  Newton  aplicado  al  polinomio  p(z)  =  z3  —  2z  +  2 
tiene  un  2-ciclo  de  la  forma  {0, 1}. 


En  efecto,  la  función  de  iteración  asociada  a  este  problema  es 

N  (z)  =  2^3  ~  ^ 

p{)  3z2  —  2 

Una  comprobación  inmediata  nos  muestra  que  1VP(0)  =  1  y  Np(l)  =  0. 


El  carácter  atractor,  repulsor  o  indiferente  de  un  n-ciclo  viene  dado  por  el  valor  de  su 
multiplicador  asociado.  Recordemos  que  si  a  =  {zo,  R(zo),  ■  ■  ■ ,  es  un  n-ciclo  de 

R,  su  multiplicador  A  =  A(a)  se  define  como  A(a)  =  (i?n),(^o)- 
Obsérvese  que,  por  la  regla  de  la  cadena,  se  tiene  que 

n—1 

( Rn)\z0 )  =  II  R'(Rj(zo)), 

3=0 

y  el  valor  A(a)  sólo  depende  de  a,  y  no  del  punto  particular  elegido  sobre  el  ciclo. 
Dependiendo  del  multiplicador  asociado,  un  n-ciclo  se  clasifica  como: 

1.  Superatractor  si  A  =  0. 

2.  Atractor  si  0  <  |A|  <  1. 

3.  Repulsor  si  |A|  >  1. 

4.  Indiferente  si  |A|  =  1. 
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Así.  el  2-ciclo  que  aparece  en  el  ejemplo  4.5  es  superatractor  ya  que 


(A?)'(0)  =  Af¿(l)7V¿(0)  =  0. 


Sea  M  un  método  iterativo  para  encontrar  raíces  de  una  ecuación  no  lineal.  Al  aplicarlo 
a  un  polinomio  complejo  p(z),  se  cumple  que  los  ceros  de  p(z)  son  puntos  fijos  atractores 
o  superatractores.  Sea  r  uno  de  tales  ceros  y  supongamos  que  la  primera  derivada  no  nula 
de  M  en  r  es  la  de  orden  k  >  1.  Entonces,  podemos  escribir  el  desarrollo  de  Taylor  de  M 
alrededor  de  r  como  sigue 

M{z )  =  r  +  My  (z  -  r)k  +  0{{z  -  r)k+1). 
k\ 

Entonces,  para  valores  de  z  cercanos  a  r,  se  tiene  que 


M(z)  —  r  «  'U  l"ir)  ( z-  r)k . 
k\ 

En  otras  palabras,  si  comenzamos  las  iteraciones  con  zo,  y  sabemos  que  orb+(Ao)  converge  a 
r,  llamando  zn+ i  =  M ( zn )  se  tiene  que 


zn+ 1  -  r  — — — (zn 

k\ 


es  decir,  localmente  tenemos  un  buen  comportamiento  de  los  iterados  por  M  para  puntos 
de  partida  «próximos»  a  la  solución  del  problema,  con  convergencia  de  orden  k.  Pero  ¿qué 
ocurre  si  elegimos  un  punto  de  partida  arbitrario?  ¿Se  puede  dar  una  descripción  global  de 
la  conducta  de  los  iterados  por  un  método  iterativo  para  encontrar  raíces?  Para  el  méto¬ 
do  de  Newton,  en  la  actualidad  existe  una  descripción  bastante  general  para  el  problema 
de  aproximar  las  raíces  de  un  polinomio  complejo,  en  particular  tenemos  los  resultados  de 
Hubbard-Schleicher-Sutherland  [70]  y  de  Schleicher  [134],  que  expondremos  más  adelante. 

Los  siguientes  teoremas  describen  la  conducta  local  de  las  iteraciones  en  vecindades  de 
órbitas  periódicas  atractoras  y  super  atractor  as,  respectivamente,  de  una  función  racional 
R(z).  Para  r  >  0,  denotamos  por  Dr  el  disco  abierto  de  centro  en  el  origen  y  radio  r,  es  decir, 
Dr  =  {z  G  C  :  |z|  <  r}. 


Teorema  4.5  (Kónigs,  [85]).  Si  zq  pertenece  a  un  n-ciclo  atractor  de  una  función  racional 
R(z),  con  multiplicador  X  =  (Rn)'(zo),  que  satisface  0  <  |A|  <  1,  entonces  existe  una  vecindad 
U  de  z0  y  un  homeomorfismo  analítico  tp  :  U  — >  Dr  (para  algún  r  >  0 ),  único,  tal  que 
<p(zo)  =  0,  <p'(zo)  —  1  y  (p(Rn(z))  =  Á<p(z)  para  todo  z  e  U . 

Teorema  4.6  (Bóttcher,  [23]).  Sea  orb+(Ao)  un  n-ciclo  superatractor  de  una  función  racional 
R{z).  Supongamos  que  (i?n)d0(zo)  ^  0,  y  que 

(Rn)\z o)  =  (fi”)"(zo)  =  •  •  •  =  (in^bzo)  =  o. 


Entonces  existe  una  vecindad  U  de  zq  y  un  homeomorfismo  analítico  <p  :  U  — >  Dr  (para  algún 
r  >  0)  tal  que  < p(z0 )  =  0,  (p'(z0)  =  1,  y  p(Rn(z))  =  ( p(z))k ,  para  todo  z  G  U . 
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Para  la  demostración  de  ambos  teoremas  el  lector  puede  consultar  [16],  [21],  [22]  o  [102], 
Usando  esos  dos  resultados,  podemos  definir  la  cuenca  de  atracción  de  un  punto  fijo 
(super) atractor  como  sigue.  Sea  £  un  punto  fijo  (super)atraetor  de  una  función  racional  R, 
entonces  existe  un  disco  abierto  _Dr(£)  de  radio  r  >  0  y  centro  en  £,  tal  que  para  cada 
zo  G  -Dr(£),  los  iterados  Rn(zo)  están  definido  para  todo  n  G  N,  están  contenidos  en  Dr( £),  y 
convergen  a  £  cuando  n  — >  oo.  El  conjunto 

m  =  u  R-nmo)  (4-i3) 

n>  0 

está  formado  por  todos  los  puntos  en  el  plano  complejo  extendido  que  por  iteraciones  de  R 
convergen  a  £.  En  otras  palabras,  =  {z  G  C  :  Rn(z )  — >  £  cuando  n  — >  ex)}.  La  cuenca 
de  atracción  inmediata,  £>*(£),  es  la  componente  conexa  de  £>(£)  que  contiene  a  £. 

La  cuenca  de  atracción  de  un  punto  fijo  (super) atractor  es  el  conjunto  abierto  maximal 
con  la  propiedad  que  si  elegimos  un  punto  w  en  B(£),  sus  iterados  Rn(w )  convergen  a  £ 
cuando  n  — >  oo. 

Si  a  =  {z0, -ñ(zo),  •  •  • , -ñ(íl_1)(£o)}  es  un  n-ciclo  (super) atractor,  entonces  su  cuenca  de 
atracción  es 

n—  1 

B(a)  =  U  Rj(B(z0)). 
j= o 

Sean  Dj(a)  las  componentes  conexas  de  B(a)  que  contienen  los  puntos 

Zo,R{z0),...,R^-1\z0), 

respectivamente.  Llamamos  a  D(a )  =  U”=o  Dj(a)  la  cuenca  de  atracción  inmediata  de  a, 
aunque  este  conjunto  no  es  conexo. 

4.2.3.  Puntos  críticos  de  una  función  racional 

Dada  una  función  racional  R  :  C  — >  C  de  grado  d,  una  propiedad  importante  de  la 
misma  es  que,  excepto  a  lo  sumo  en  una  cantidad  finita  de  puntos  w  G  C,  el  conjunto 
i?-1  (te)  =  {z  G  C  :  R(z)  =  w}  está  formado  por  d  elementos  distintos.  Para  verlo,  aplicamos 
el  teorema  fundamental  del  álgebra  al  polinomio  pw(z)  =  P(z)  —  wQ(z).  Notemos  que  el 
grado  de  pw  es  exactamente  d ,  excepto  para  w  =  0  y,  a  lo  sumo,  para  otro  valor  w  para  el 
cual  se  puede  anular  el  coeficiente  principal  de  pw.  Ahora,  si  pw(z)  =  0  y  p'w{z)  =  0,  es  decir, 

P{z)  _  _  P'{z) 

W)  ~ w  ~ 

obtenemos  la  ecuación  P'(z)Q(z )  —  P(z)Q'(z)  =  0,  que  tiene  sólo  una  cantidad  finita  de 
soluciones.  En  otras  palabras,  excepto  posiblemente  para  una  cantidad  finita  de  valores  de 
w,  el  polinomio  pw(z)  no  tiene  raíces  múltiples,  por  lo  tanto  tiene  d  soluciones  distintas. 

Estas  observaciones  nos  conducen  directamente  a  uno  de  los  conceptos  fundamentales  en 
el  estudio  de  la  dinámica  de  funciones  racionales,  como  es  el  de  punto  crítico. 
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Definición  4.4.  Sea  R  una  función  racional  de  grado  d.  Un  punto  w  G  C  para  el  cual  la 
cardinalidad  de  R~1(w )  es  menor  que  d  es  llamado  un  valor  crítico  de  R.  Un  punto  z  G 
R~1(w)  que  es  una  raíz  de  R(z)  —  w  con  multiplicidad  mayor  que  1,  es  llamado  un  punto 
crítico  de  R. 

Ejemplo  4.6.  Encuentre  los  puntos  críticos  de  R(z)  =  (z  —  a)/ (z  —  b)2 . 


Dado  w  6  C,  la  ecuación  R(z)  =  u>  tiene  dos  soluciones  distintas,  excepto  si  se 
anula  el  discriminante  de  la  ecuación  polinómica 

ojz  —  (26cn  -t-  1)^  4~  a  T  uU . 


Esto  ocurre  cuando  u  =  l/(4(a  —  b ))  que  es,  por  tanto,  un  valor  crítico.  El  punto 
crítico  asociado  es 


2bu  +  1 

z  =  — - - =  2a  —  b. 

2c o 


Pero,  además,  si  u  =  oo,  R  1(cu)  =  b,  por  lo  que  u 
este  caso,  asociado  al  punto  crítico  z  =  b. 


oo  es  otro  valor  crítico,  en 


Intuitivamente,  si  z  es  un  punto  crítico  de  R,  entonces  R  deja  de  ser  inyectiva  en  un 
entorno  de  z.  Es  fácil  ver  que  el  conjunto  de  puntos  críticos  de  R(z)  =  P(z)/Q(z)  está 
formado  por  los  ceros  de  R'(z),  los  polos  de  R(z)  con  multiplicidad  mayor  que  1,  es  decir,  los 
ceros  de  Q(z)  de  multiplicidad  mayor  que  1,  y  posiblemente,  oo. 

Como  la  dinámica  de  las  transformaciones  de  Móbius,  es  decir,  funciones  racionales  de  gra¬ 
do  uno,  es  a  la  vez  bien  comprendida  y  elemental  (véase  [2]),  en  lo  que  sigue  nos  centraremos 
sólo  en  la  dinámica  de  funciones  racionales  R  con  grado (R)  >  2. 

Un  cálculo  directo  usando  la  regla  de  la  cadena  nos  permite  probar  el  siguiente  resultado. 

Teorema  4.7.  Sea  C  =  C(R)  el  conjunto  de  puntos  críticos  de  una  función  racional  R. 
Entonces 

(a)  El  conjunto  de  puntos  críticos  de  Rn  es 

c(Rn)  =  cur‘(c)u-u  R~n(C). 


(b)  El  conjunto  de  valores  críticos  de  Rn  es 

R(C)  U  R2(C)  U  •  •  •  U  Rn{C). 


El  siguiente  teorema  relaciona  las  cuencas  de  atracción  y  los  n-ciclos  atractores. 

Teorema  4.8  (Fatou  y  Julia).  La  cuenca  de  atracción  inmediata  de  un  ciclo  (super) atractor, 
contiene  al  menos  un  punto  crítico. 


4.3.  Los  conjuntos  de  Fatou  y  Julia 


141 


Este  resultado  es  fundamental,  pues  nos  dice  que  para  determinar  los  ciclos  (super) atractores, 
debemos  estudiar  las  iteraciones  de  los  puntos  críticos  de  la  función  de  iteración  es  cuestión. 

Teorema  4.9.  Una  función  racional  de  grado  d  >  2  tiene  2d  —  2  puntos  críticos  contados 
con  su  multiplicidad. 

El  teorema  de  Shishikura  (1987)  da  una  cota  sobre  la  cantidad  máxima  de  ciclos  (su¬ 
per)  atractores  o  indiferentes  que  puede  tener  una  función  racional.  Su  demostración  puede 
verse  en  [16],  [26]  o  [102], 

Teorema  4.10  (Shishikura,  [138]).  Una  función  racional  R  :  C  — >  C  de  grado  d  tiene  a  los 
más  2d  —  2  ciclos,  los  cuales  pueden  ser  (super) atractores  o  indiferentes. 

El  siguiente  resultado  muestra  que  la  cota  máxima  para  el  número  de  ciclos  puede  ser 
alcanzada. 

Teorema  4.11  (Hurley,  [71]).  Para  cada  d  >  2  existe  un  polinomio  p(z )  de  grado  d,  con 
coeficientes  reales,  tal  que  el  método  de  Newton  Np  tiene  2d  —  2  ciclos  atractores  en  el  plano 
complejo,  es  decir,  posee  el  número  maximal  de  ciclos  atractores  que  una  función  racional  de 
grado  d  puede  tener. 

4.3.  Los  conjuntos  de  Fatou  y  Julia 

Existen  varias  formas  de  comenzar  las  exposiciones  de  la  teoría  de  P.  Fatou  y  G.  Julia 
(1919  y  1918).  Adoptamos  en  estas  notas  la  de  Fatou  [51],  [52],  Éste  se  basa  en  el  concepto 
de  familia  normal  debido  a  Montel  (véase  [2]). 

Definición  4.5.  Una  familia  V  de  funciones  meromorfas  definidas  en  un  dominio  U  C  C 

T  =  {fi  :  U  — >  C  :  fi  meromorfa} 

es  normal  si  cada  sucesión  (fn)n£N  de  elementos  de  V  tiene  una  subsucesión  (/nfe)fceN  Que 
converge  uniformemente  sobre  cada  subconjunto  compacto  de  U . 

Recordemos  que  una  familia  V  de  funciones  de  un  espacio  métrico  X  en  un  espacio  métrico 
Y  es  equicontinua  si,  para  cada  £  >  0  dado,  existe  5  >  0  tal  que 

d(x  1,^2)  <  5  implica  d(f(x  1),  f(x 2))  <  s,  para  toda  /  €  T. 

Considerando  la  métrica  cordal  o  la  esférica  en  C,  se  tiene  el  siguiente  resultado. 

Teorema  4.12.  Una  familia  de  funciones  meromorfas  T  de  U  en  C  es  7iormal  si  y  sólo  si 
es  equicontinua  sobre  todos  los  subconjuntos  compactos  de  U. 
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El  siguiente  teorema  nos  proporciona  otro  criterio  para  determinar  cuándo  una  familia  de 
funciones  es  normal. 

Teorema  4.13  (Montel).  Sea  F  —  {f  :  U  — >  C}  una  familia  de  funciones  analíticas.  Si 
[jfer  f(U)  omite  tres  puntos,  entonces  F  es  normal,  esto  es,  si  existen  tres  puntos  a,  ¡3,  7 
tales  que 

U  f(U)  CÜ- {«,/?, 7}, 
fe  r 

la  familia  T  es  normal. 

Ahora  nos  centraremos  en  la  familia  de  iterados  { Rn  :  n  =  0, 1,  2,  3, . . .}  de  una  función 
racional  R  :  C  — >  C.  En  este  caso,  equicontinuidad  significa  que  iteraciones  de  puntos 
próximos  no  divergen. 

Definición  4.6.  Un  punto  z  é  C  pertenece  al  conjunto  de  Fatou  ÍF(R)  (también  llamado 
dominio  de  normalidad )  si  existe  una  vecindad  U  de  z  tal  que  la  familia  de  iterados 

F  =  {Rn  :  [/^C:  n  =  0,l,2,3,...} 


es  normal  en  U . 

El  conjunto  de  Julia  de  R,  denotado  por  J(R)  o  simplemente  por  J ,  cuando  no  exista 
peligro  de  confusión,  es  el  complemento  del  conjunto  de  Fatou,  esto  es,  J{R)  =  C  —  T(R). 

Es  claro,  a  partir  de  su  definición,  que  T(R)  es  abierto  y  en  consecuencia  J ( R )  es  cerrado. 
Un  dominio  en  el  conjunto  de  Fatou  es  una  componente  conexa  abierta  del  conjunto  de  Fatou. 
Del  teorema  de  Montel  4.13,  se  sigue  el  siguiente  resultado. 

Teorema  4.14  (Montel).  Si  z  G  J(R)  y  U  es  una  vecindad  de  z,  entonces  {Rm(U)}m£^ 
cubre  todo  C,  excepto  a  lo  más  dos  puntos. 

Definición  4.7.  Sea  U  un  conjunto  abierto  no  vacío  de  C.  Definimos  el  conjunto  de  puntos 
omitidos  de  la  aplicación  racional  R\u  como  el  conjunto 

Eu  =  C  -  |J  Rn(U). 

n>  0 

Del  teorema  4.14  se  tiene  el  siguiente  resultado. 

Corolario  4.15.  Sea  z  G  J(R)  y  sea  U  una  vecindad  abierta  de  z.  Entonces  Eu  contiene  a 
lo  más  dos  puntos. 

Teorema  4.16.  El  conjunto  de  puntos  omitidos  de  una  función  racional  R  es  independiente 
del  punto  z  G  J  usado  para  definirlo.  Por  lo  tanto  lo  podemos  denotar  simplemente  por  Er. 

A  continuación,  veremos  algunas  propiedades  de  los  conjuntos  de  Julia  y  de  Fatou  aso¬ 
ciados  a  una  función  racional  R  :  C  — >  C  de  grado  mayor  o  igual  que  2. 


4.3.  Los  conjuntos  de  Fatou  y  Julia 


143 


Teorema  4.17.  El  conjunto  de  Julia,  J(R),  es  no  vacío. 

Demostración.  Si  J(R)  =  0  entonces  E(R)  =  C.  Luego  la  familia  de  iterados  { Rn  : 
n  =  0,1,2,...}  es  normal  sobre  C,  y  en  consecuencia  existe  una  subsucesión  {Rnk}  que 
converge  uniformemente  sobre  C  a  una  función  analítica  G.  Como  G  es  analítica  sobre 
C,  es  de  hecho  una  función  racional,  luego  grado(G)  <  oo.  Ahora  como  grado  (/?"*)  = 
(grado(l?))n,í  — >  oo  cuando  k  — >  oo.  Esto  es  una  contradicción,  pues  se  debe  tener  que 
grado  (G)  =  lím^oo  grado  (Rnk).  □ 

Teorema  4.18.  Supongamos  que  z0  G  C  está  sobre  un  ciclo.  Si  este  ciclo  es  (super) atractor, 
entonces  está  contenido  en  el  conjunto  de  Fatou,  y  si  es  repulsor  está  contenido  en  el  conjunto 
de  Julia  de  R. 

Sea  M  un  método  iterativo  para  aproximar  soluciones  de  una  ecuación  f(z)  =  0.  Una 
propiedad  fundamental  que  debe  tener  M  es  que  los  ceros  de  f(z)  son  punto  fijos  (su¬ 
per)  atractores  de  M f,  función  de  iteración  obtenida  al  aplicar  M  a  /.  Tenemos  así  el  siguiente 
resultado. 

Teorema  4.19.  Sea  M  un  método  iterativo  para  aproximar  ceros  de  una  función  f(z).  De¬ 
notemos  por  Mf  la  función  de  iteración  obtenida  al  aplicar  M  a  f .  Entonces  los  ceros  de  f 
están  contenidos  en  el  conjunto  de  Fatou  íF(Mf)  de  M¡. 

Teorema  4.20.  Si  zr  es  un  punto  en  un  ciclo  repulsor,  entonces 

J(R)  =  clausura}^  G  C  :  Rn(z )  =  zr,  n  G  N}. 

Esta  proposición  nos  da  un  algoritmo  para  representar  gráficamente  el  conjunto  de  Julia. 
Para  ello  basta  encontrar  un  punto  fijo  o  un  punto  en  un  ciclo  repulsor  y  considerar  sus 
preimágenes.  Computacionalmente  este  algoritmo  es  lento,  pero  para  polinomios  de  grado 
pequeño  es  efectivo. 

Teorema  4.21  (Teorema  fundamental  de  Fatou  y  Julia).  Los  ciclos  repulsores  son  densos 
en  J{R),  es  decir, 

J(R)  =  clausura {z  G  C  :  z  pertenece  a  un  ciclo  repulsor  de  R}. 

En  particular,  existe  una  cantidad  infinita  de  ciclos  repulsores  y  cada  z  G  J ( R )  es  obtenido 
como  límite  de  puntos  en  ciclos  repulsores. 

Esta  propiedad  es  particularmente  interesante,  pues  nos  dice  que,  debido  a  los  errores 
computacionales  (por  muy  pequeños  que  ésos  sean),  al  iterar  un  punto  de  partida  que  está 
sobre  el  conjunto  de  Julia  de  R  se  obtiene  una  órbita  que  tenderá  a  «alejarse»  del  conjunto 
de  Julia.  En  particular,  si  éste  tiene  medida  de  Lebesgue  cero,  entonces,  lo  más  probable  es 


144 


Método  de  Newton  en  el  plano  complejo 


que  después  de  un  número  pequeño  de  iterados,  las  siguientes  iteraciones  estén  en  el  conjunto 
de  Fatou,  donde  tenemos  esperanza  de  convergencia  a  alguna  de  las  raíces. 

Como  una  observación  interesante,  podemos  comentar  que  G.  Julia  comienza  su  memoria 
[72]  focalizando  su  atención  sobre  la  clausura  del  conjunto  de  puntos  periódicos  repulsores, 
y  muestra  que  su  complemento  es  la  unión  de  dominios  sobre  el  cual  la  familia  de  iterados 
{Rn  :  n  >  0}  es  normal. 

Teorema  4.22.  El  conjunto  de  Julia  de  una  función  racional  R  es  un  conjunto  perfecto,  es 
decir,  J  ( R )  es  cerrado  y  no  tiene  puntos  aislados. 


El  teorema  siguiente  nos  dice  que  mediante  una  transformación  afín  podemos  transformar 
las  raíces  de  un  polinomio  p  sin  modificar  cualitativamente  la  dinámica  del  método  de  Newton. 

Teorema  4.23  (Reescalamiento).  Sea  T(z)  =  az  +  ¡3,  con  a  ^  0 ,  y  sea  q(z)  =  p{T(z ))  = 
poT(z).  Entonces 

T  o  Nqo  T~l  —  Np, 

esto  es,  T  es  una  conjugación  entre  Np  y  Nq. 

Demostración.  Notemos  que  p  =  q  o  T~l  y  que  oT1  q' (T~l (z))  =  p'{z).  Ahora, 


ToNqoT-\z)  =  T{Nq{T~\z ))) 


=  rir-'u)- 


<?( Tpjz]) 

q'(T-Hz)) 


=  z 


a(T-Hz)_dum)+l3 

1  {>  q'(T-\z)))+P 

.  gpyw) 

a  a  J  a~1q'(T~1(z)) 
P(z. 


fz  P 

al - 


+  / 3 


P'(z) 


=  Np(z). 


Esto  completa  la  prueba  del  teorema. 


□ 


El  teorema  4.23  es  válido  para  muchos  métodos,  entre  los  cuales  podemos  citar  los  métodos 
de  Halley,  Chebyshev  o  Whittaker,  entre  otros. 

De  forma  más  general,  podemos  enunciar  el  siguiente  resultado  (véase  [82],  por  ejemplo) 
que  establece  que  la  dinámica  de  dos  funciones  racionales  conjugadas  por  una  transformada 
de  Móbius  es  equivalente.  De  hecho,  las  cuencas  de  atracción  y  sus  correspondientes  fronteras 
(conjuntos  de  Julia)  asociadas  a  una  función  racional  son  conformemente  equivalentes  a  los 
de  la  otra. 


Teorema  4.24.  Sea  R  una  aplicación  racional  y  M  una  transformada  de  Móbius.  Definimos 
una  nueva  aplicación  racional  S  =  M  o  R  o  M_1.  Entonces 


F{S)  =  M{F{R))  y  J(S)  =  M{J{R)). 
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Una  aplicación  de  este  tipo  de  ideas  nos  conduce  al  siguiente  resultado,  que  caracteriza  el 
comportamiento  dinámico  del  método  de  Newton  cuando  se  aplica  a  polinomios  cuadráticos. 

Teorema  4.25  (Cayley,  Schróder).  Sea  p(z)  un  polinomio  cuadrático  con  sus  dos  raíces 
distintas,  entonces  el  método  de  Newton  Np(z)  aplicado  a  p  es  conjugado  a  la  función  g(z )  = 
¿2. 

Demostración.  Sean  a ,  ¡3  con  a  ^  ¡3,  las  raíces  de  p(z).  Tenemos  entonces  que  p(z)  = 
(z  —  a)(z  —  (3),  y  sin  perdida  de  generalidad,  podemos  suponer  que  0  <  |a|  <  \¡3\.  Sea 
T(z)  =  ((3—a)z+a,  entonces poT(z)  —  p(T(z))  =  {¡3— a)z((¡3— a)z+a— ¡3)  =  {¡3— a)2z(z— 1). 
Sean  A  =  ¡3  —  a  y  q\(z)  =  X2z(z  —  1),  es  decir,  q\=  poT.  Por  el  teorema  4.23,  tenemos  que 
T  o  Nqx  o  T'1  =  Np.  Ahora,  tomando  q(z)  =  z(z  —  1),  se  ve  que  Nq  =  Nqx.  Luego,  Np  es 
conjugada  a  Nq.  Finalmente,  es  fácil  probar  que  Nq  es  conjugada  a  la  aplicación  g(z)  =  z2. 
Esto  termina  la  prueba.  □ 

Teorema  4.26.  Si  z  G  J{R)  entonces 

J(R)  =  clausurajz  G  C  :  Rn(z )  =  z,  para  algún  n  G  N}. 

Teorema  4.27.  Sea  R  una  función  racional,  entonces  J(R)  y  R(R)  son  completamente 
invariantes,  es  decir 

R(J(R))  =  J(R)  =  R-\J(R)),  R(F(R))  =  R{R)  =  R-\R(R)). 

Teorema  4.28.  Los  conjuntos  de  Julia  de  R  y  de  Rm ,  con  m  G  N,  son  el  mismo.  En  otras 
palabras,  J(R)  =  J(Rm). 

Teorema  4.29.  Sea  za  un  punto  periódico  atractor  de  una  función  racional  R.  Entonces 
J(R)  =  dB(za)  (dA  denota  la  frontera  del  conjunto  A). 

Esta  proposición  nos  da  una  algoritmo  bastante  eficiente  para  dibujar  el  conjunto  de  Julia. 
Para  ello  basta  encontrar  un  punto  fijo  atractor  za  de  R  y  fijando  un  error  £  >  0  pintamos 
de  un  color  determinado  los  puntos  z  en  una  región  acotada  (en  general  un  rectángulo)  tales 
que  para  algún  n  >  1,  se  tiene  \Rn(z)  —  za\  <  s.  Este  algoritmo  se  conoce  como  algoritmo  de 
tiempo  de  escape.  Por  otra  parte,  podemos  definir  los  conjuntos  de  nivel,  Lf¡(za),  i  —  1,  2,  3, . . . 
como  sigue:  sea  0  <  £  <<  1  (aquí  <<  significa  «bastante  menor  que»)  y  sea 

L0(za)  =  {z  G  C  :  \z  -  za\  <  e}, 

y,  para  k  =  0, 1, . . ., 

Lk+1(za)  =  {zGC  -  Lk(za )  :  Rk(z)  G  Lk(za)}. 

Se  tiene  que 

dLk(za)  -  J(R), 
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donde  el  límite  es  tomado  respecto  de  la  métrica  de  Hausdorff  en  /C(C)  =  {K  c  C  : 
K  es  compacto}.  Una  forma  de  obtener  gráficas  vistosas  del  conjunto  de  Julia  con  este  algo¬ 
ritmo  es  colorear  cada  conjunto  de  nivel  Lk  con  el  color  k  correspondiente  módulo  P ,  donde 
P  es  el  número  de  colores  de  la  resolución  gráfica  del  particular  monitor,  en  general  P  =  16. 
En  caso  que  za  sea  periódico,  tomamos  \Rpn  —  za\  <  s,  donde  p  es  el  período  de  za. 

Corolario  4.30.  Si  E(R)  es  no  vacío,  entonces  el  conjunto  de  Julia  de  R,  J(R),  no  tiene 
puntos  interiores. 

Demostración.  Sea  U  un  dominio  abierto  contenido  en  J(R).  Como  J(R)  es  invariante, 

J(R)D  U  Rn(U)  =  C-ER. 

n>  0 

Además,  como  J ( R )  es  cerrado  y  ER  contiene  a  lo  más  dos  puntos,  se  tiene  que  J ( R )  =  C.  □ 


El  resultado  anterior  junto  con  el  teorema  4.29  tienen  aplicaciones  directa  en  el  caso  de 
métodos  iterativos  para  aproximar  ceros  de  una  función  f(z),  pues  como  estamos  asumiendo 
que  las  raíces  correspondan  a  puntos  fijos  (super) atractores,  estos  pertencen  al  conjunto  de 
Fatou  de  la  correspondiente  función  racional  M¡,  por  lo  tanto  se  tiene  que  el  conjunto  de 
Fatou,  es  no  vacío  y  J{Mfi)  =  dB(a),  donde  a  es  un  cero  de  /,  y  J(Mf)  no  tiene 

puntos  interiores. 


Corolario  4.31.  Si  D  es  un  dominio,  con  D  n  J{R)  =  J*  0,  entonces  existe  rn  G  N  tal 
que  Rm{J*)  =  J(R). 


Existe  un  ejemplo  clásico,  debido  a  Lattés,  [89],  en  el  que  se  prueba  que  el  conjunto  de 
Julia  asociado  a  la  función  racional 


R(z) 


(¿2  +  l)2 
4  z(z2  —  1) 


es  todo  el  plano  complejo  ampliado,  J(R)  =  C.  No  obstante,  este  tipo  de  situaciones  no 
pueden  ocurrir  para  las  funciones  de  iteración  usadas  para  aproximar  ceros  de  una  función. 


Definición  4.8.  Sea  £  G  C  un  punto  fijo  (que  no  es  un  polo)  de  una  función  racional  R,  con 
multiplicador  X  —  R'(£)  ^  0.  Decimos  que  R  es  linealizable  en  f  si,  existe  una  vecindad  U  de 
f  y  una  función  analítica  h,  tal  que  h(f)  =  f,  es  inyectiva  en  U  U  R{U),  y  satisface 


hoRoh  1(z)  —  £  +  X(z  —  £),  para  todo  z  e  h(U).  (4-14) 


Definición  4.9.  Un  punto  fijo  f  de  una  función  racional  R  es  aislado  si  existe  una  vecindad 
U  de  f  que  no  contiene  otros  puntos  fijos  o  sobre  un  ciclo,  aparte  de  f. 

Teorema  4.32  (Siegel).  Sea  R  una  función  racional  de  grado  d  >  2.  Supongamos  que  f  es 
un  punto  fijo  de  R  con  multiplicador  A  ^  0.  Entonces  R  es  linealizable  en  f  si  y  sólo  si  f  es 
un  punto  fijo  aislado  de  R. 


4.3.  Los  conjuntos  de  Fatou  y  Julia 
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Definición  4.10.  Un  punto  fijo  irracionalmente  indiferente  f  de  una  función  racional  R  es 
llamado  un  punto  de  Siegel,  si  R  es  linealizable  en  f,  caso  contrario  es  llamado  un  punto  de 
Cremer. 

Teorema  4.33.  Sea  £  un  punto  fijo  irracionalmente  indiferente  de  una  función  racional  R. 
Entonces  R  es  linealizable  en  £  si  y  sólo  si  tj  es  aislado. 

Definición  4.11.  Sea  D  una  componente  del  conjunto  de  Fatou.  Decimos  que  D  es  periódica 
si  existe  n  >  1  tal  que  Rn(D)  =  D ,  y  decimos  que  D  es  preperiódica  si  existe  k  >  1  tal  que 
Rk(D)  es  periódico. 

El  siguiente  teorema  caracteriza  y  clasifica  las  componentes  del  conjunto  de  Fatou  asociado 
a  una  función  racional.  Su  demostración  se  puede  ver  en  [16]  o  [21], 

Teorema  4.34  (Dominios  no  errantes  de  Sullivan,  [142]).  Sea  R  una  función  racional.  En¬ 
tonces  todas  las  componentes  del  conjunto  de  Fatou  son  preperiódicas.  Además,  sólo  existe 
una  cantidad  finita  de  componentes  periódicas. 

Sea  U  una  componente  periódica  del  conjunto  de  Fatou  de  R,  la  cual  podemos  suponer 
que  es  fija,  entonces  U  es  de  uno  de  los  siguientes  cinco  tipos: 

(i)  Superatractoras:  contiene  un  punto  fijo  superatractor. 

(ii)  Atractoras:  contiene  un  punto  fijo  atractor. 

(iii)  Parabólicas  (o  dominio  de  Leau):  existe  un  punto  fijo  parabólico  (o  racionalmente  indi¬ 
ferente)  en  su  frontera. 

(iv)  Disco  de  Siegel:  contiene  un  punto  fijo  irracionalmente  indiferente  que  es  un  punto  de 
Siegel.  En  este  caso,  U  es  analíticamente  equivalente  a  un  disco  y  la  restricción  de  R  a 
U  es  analíticamente  conjugada  a  una  rotación  de  ángulo  irracional. 

(v)  Anillo  de  Hermán:  contiene  un  punto  fijo  irracionalmente  indiferente  que  es  un  punto 
de  Cremer.  En  este  caso,  U  es  analíticamente  equivalente  a  un  anillo  y  la  restricción 
de  R  a  U  es  analíticamente  conjugada  a  una  rotación  de  ángulo  irracional. 

Teorema  4.35.  Sea  U  una  componente  del  conjunto  de  Fatou  de  una  función  racional  R  de 
grado  d  >2,  la  cual  podemos  suponer  fija.  Sea  C  =  C(R)  su  conjunto  de  puntos  críticos,  y 

OO 

C+(R)  =  |J  Rn(C). 

n= 1 

el  conjunto  postcrítico  de  R. 

(a)  Si  U  es  una  componente  (super)atractora  o  parabólica,  entonces  U  debe  contener  al 
menos  un  punto  crítico. 
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(b)  Si  U  es  un  disco  de  Siegel  o  un  anillo  de  Hermán,  entonces  la  froritera  de  U  está 
contenida  en  la  clausura  de  C+(R). 

En  particular,  si  R  tiene  un  anillo  de  Hermán,  entonces  J ( R )  no  es  conexo. 

El  teorema  anterior  toma  en  cuenta  todos  los  puntos  sobre  ciclos,  excepto  aquéllos  sobre 
ciclos  irracionalmente  indiferentes  que  pertenecen  al  conjunto  de  Julia  J(R),  esto  es,  los 
puntos  de  Cremer. 

El  siguiente  resultado  muestra  la  conexión  entre  los  puntos  de  Cremer  y  los  iterados  de 
puntos  críticos. 

Teorema  4.36.  Todo  punto  de  un  ciclo  irracionalmente  indiferente  que  está  contenido  en  el 
conjunto  de  Julia  J(R)  de  una  función  racional  R  es  un  punto  límite  del  conjunto  C+(R). 

El  siguiente  resultado  establece  la  conexión  entre  los  puntos  críticos  de  una  función  ra¬ 
cional  y  los  ciclos  de  componentes  del  conjunto  de  Fatou.  En  concreto,  da  una  cota  sobre  el 
número  de  componentes  de  Fatou  asociadas  a  una  función  racional. 

Teorema  4.37  (Shishikura).  Sea  R  una  función  racional  de  grado  d  >  2.  El  número  total 
de  componentes  de  Fatou  cíclicas,  es  decir,  componentes  cíclicas  atractoras,  superatractoras, 
parabólicas,  discos  de  Siegel  y  anillos  de  Hermán,  está  acotado  por  2d  —  2. 

Sobre  el  número  de  componentes  de  Fatou,  se  tiene  el  siguiente  resultado 

Teorema  4.38.  El  conjunto  de  Fatou  de  una  función  racional  R  tiene  0,  1,  2  o  una  cantidad 
infinita  de  componentes. 

Corolario  4.39.  Denotemos  por  Mp  a  un  método  iterativo  para  aproximar  raíces  de  un  po¬ 
linomio  p(z).  Supongamos  que  las  raíces  de  p(z)  son  puntos  fijos  atractores  o  superatractores 
de  Mp  y  que  p(z)  tiene  al  menos  3  raíces  distintas.  Entonces  ÍF(MV)  tiene  una  cantidad 
infinita  de  componentes. 

El  recíproco  del  corolario  anterior  no  es  verdadero.  Por  ejemplo,  si  consideramos  el  método 
de  Chebyshev  introducido  en  (2.8), 

Ch,(z)  =  z  -  (l  +  (4.15) 

aplicado  al  polinomio  cuadrático  p(z)  =  z1  —  1,  vemos  que  el  conjunto  de  Fatou  tiene  infinitas 
componentes,  como  se  aprecia  en  la  figura  4.2. 

El  comportamiento  de  los  iterados  sobre  una  componente  de  Fatou  es  descrito  por  el 
siguiente  teorema. 

Teorema  4.40.  Sea  U  una  componente  de  Fatou  de  una  función  racional  R  de  grado  d  >  2, 
que  no  contiene  valores  críticos  de  R.  Entonces  R~l{U)  consiste  de  d  componentes  de  Fatou 
U\, ...  ,U ci  tales  que  R  aplica  cada  Ui  homeomórficamente  sobre  U.  Además,  Ui  es  simplemente 


conexa. 
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Figura  4.2:  Cuencas  de  atracción  del  método  de  Chebyshev  aplicado  al  polinomio  p(z)  = 
z2  —  1.  En  cian  aparecen  los  puntos  cuyas  órbitas  convergen  a  la  raíz  z  =  1  y  en  magenta  los 
puntos  cuyas  órbitas  convergen  a  la  raíz  z  =  —  1. 


Dada  una  componente  de  Fatou  arbitraria  de  una  función  racional  R  de  grado  d  >  2,  se 
tiene  que  R~l{U )  está  formado  por  k  componentes  distintas  U\, . . . ,  £4,  on  k  <  d,  las  cuales 
son  disjuntas  a  pares  si  k  >  2.  Además,  la  restricción  de  R  a  £/,  es  una  función  racional  de 
grado  di,  con  la  propiedad  que  J2í=i  di  =  d.  Por  lo  tanto  la  preimagen  de  un  punto  z  G  C 
tiene  di  copias  en  la  componente  Ut. 

Por  ejemplo,  cuando  aplicamos  el  método  de  Newton  al  polinomio  p(z)  =  z3— 1,  obtenemos 
la  función  racional 


R(z)  = 


2z3  +  1 
3  z2 


Consideremos  la  cuenca  de  atracción  inmediata  de  una  de  las  raíces,  digamos  £  =  1,  la  cual 
denotamos  por  U\ .  Tenemos  que  Rrl  (U i )  está  formado  por  dos  componentes,  U\  misma  y 
otra  que  denotamos  por  f/2,  con  grado(/?,|£/i)  =  2  y  grado(i?|£/i)  =  1.  Por  lo  tanto,  como  la 
preimagen  de  un  punto  en  U\  consiste  de  2  preimágenes  en  U ,  y  una  en  U2,  es  claro  que  £ 
tiene  multiplicidad  2. 


4.4.  Algunas  propiedades  del  método  de  Newton  en  el 
plano  complejo 


Sea  p(z)  =  ad.zd  +  •  •  •  +  a\Z  +  a0,  con  ^  0,  un  polinomio  de  grado  d  en  C,  y  sea 
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su  método  de  Newton. 

Veamos  algunas  propiedades  elementales  de  la  dinámica  de  Np: 

(1)  Np(z0 )  =  Zq  si  y  sólo  si  p(z0)  =  0,  es  decir,  los  puntos  fijos  de  Np  son  las  raíces  de  p. 

(2)  z  —  oo  es  siempre  un  punto  fijo  de  Np,  y  como  N'( oo)  =  ^  este  punto  fijo  es  repulsor. 
Por  lo  tanto,  si  el  método  de  Newton  produce  un  punto  cerca  de  oo,  sus  sucesivas 
iteraciones  se  aproximan  a  una  parte  compacta  de  C. 

(3)  Puesto  que  Np(z)  =  si  z0  es  una  raíz  simple  de  p,  se  tiene  que  Np(z0)  =  0,  esto 

es,  Zq  es  un  punto  fijo  superatractor  de  Np,  lo  cual  implica  que  Np  es  conjugada  a  la 
aplicación  z  — >  zk,  para  algún  k  >  1  en  una  vecindad  de  zq. 

(4)  Las  raíces  múltiples  de  p  son  puntos  fijos  atractores,  pero  no  super atractores,  de  Np, 

pues  si  z0  tiene  multiplicidad  m  >  1,  entonces  Np(z0)  =  <  i. 

(5)  Para  polinomios  genéricos  de  grado  d,  esto  es,  tienen  todas  sus  raíces  distintas,  el 
método  de  Newton  es  una  función  racional  de  grado  d.  Cuando  el  polinomio  tiene 
raíces  múltiples,  Np  tiene  grado  menor  que  d. 

(6)  Los  puntos  críticos  de  Np  son  las  raíces  simples  y  los  puntos  de  inflexión  de  p.  Los  puntos 
críticos  de  Np  que  no  son  raíces  de  p  los  llamaremos  puntos  críticos  libres.  Recuerde  que 
vimos  en  la  sección  anterior  que  las  propiedades  del  conjunto  de  Julia  de  una  función 
analítica  en  C  son  frecuentemente  determinadas  por  las  órbitas  de  sus  puntos  críticos. 

(7)  Los  puntos  críticos  de  p,  es  decir,  las  raíces  de  p'{z)  =  0,  son  los  polos  de  Np. 

Las  propiedades  anteriores  caracterizan  completamente  al  método  de  Newton,  es  decir, 
tenemos  el  siguiente  resultado. 

Teorema  4.41.  Una  función  racional  R  :  C  — »  C  de  grado  d  >  2  es  la  función  de  Newton 
de  un  polinomio  de  grado  mayor  o  igual  que  2  si  y  sólo  si  el  punto  z  =  oo  es  el  único  punto 
fijo  repulsor  y  para  todos  los  otros  puntos  fijos  £i, . . .  ,£<¿  G  C  existe  un  número  nj  G  N,  tal 
que  R%)  =  ^  <  1. 

Este  resultado  fue  probado  por  G.  Saunder  en  1984  ([132]).  También  se  le  atribuye  a  J. 
Head  ([63])  en  1987  y  a  K.  Nishizawa  y  M.  Fujimura  en  1992  (véase  [106]).  En  particular,  ese 
resultado  contiene  el  caso  del  método  de  Newton  para  polinomios  con  raíces  simples.  Para 
otros  métodos,  no  se  tiene  una  tal  resultado,  aún  en  el  caso  de  polinomios  con  raíces  simples. 

El  primer  resultado  acerca  de  la  ubicación  de  los  puntos  críticos  de  un  polinomio  es  el 
teorema  clásico  de  Gauss-Lucas,  que  enunciamos  a  continuación. 

Teorema  4.42  (Gauss-Lucas,  [92]).  Los  puntos  críticos  de  un  polinomio  no  contante  p  están 
contenidos  en  la  envoltura  convexa  de  sus  raíces. 
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El  siguiente  teorema  es  importante  para  la  descripción  global  de  las  posible  conducta  de 
los  iterados  por  el  método  de  Newton. 

Teorema  4.43  (Shishikura,  [138]).  Sea  R  un  función  racional  que  posee  un  único  punto  fijo 
repulsor  o  racionalmente  indiferente  con  multiplicador  X  =  1,  entonces  J(R)  es  conexo. 

Como  z  =  oo  es  el  único  punto  fijo  repulsor  para  la  función  de  iteración  del  método  de 
Newton,  Np,  deducimos  la  siguiente  consecuencia. 

Corolario  4.44.  Sea  p(z)  un  polinomio  complejo,  entonces  el  conjunto  de  Julia  de  Np  es 
conexo. 

Nota  4.1.  Esta  propiedad  del  conjunto  de  Julia  del  método  de  Newton  cuando  es  aplicado 
a  polinomios  es  una  parte  fundamental  en  la  demostración  del  teorema  j.60  de  Hubbard, 
Schleicher  y  Sutherland  y  que  en  esencia  dice  que  el  método  de  Newton  es  un  algoritmo 
eficiente  para  el  cálculo  de  raíces  de  polinomios.  Este  teorema,  junto  con  el  resultado  de 
Schleicher  (véase  el  teorema  j.61),  nos  permite  concluir  que  el  método  de  Newton  es,  por 
tantoo,  un  algoritmo  iterativo. 

4.4.1.  El  método  de  Newton  para  polinomios  cuadráticos 

Como  ya  se  puso  de  manifiesto  al  enunciar  el  problema  de  Cayley  en  los  antecedentes 
de  este  capítulo,  el  estudio  dinámico  del  método  de  Newton  aplicado  a  polinomios  de  la 
forma  p(z)  =  (z  —  a)(z  —  b )  es  relativamente  sencillo.  En  el  teorema  4.25  se  vio  que  Np(z) 
es  conjugado  con  la  aplicación  g(z)  =  z 2 .  Veamos  ahora  una  nueva  demostración  de  este 
resultado,  poniendo  de  manifiesto  que  el  conjunto  de  Julia  J(NP )  es  la  recta  que  equidista  de 
los  puntos  a  y  b. 

Teorema  4.45.  Sea  Np  la  aplicación  de  Newton  para  el  polinomio  p(z)  =  (z  —  a)(z  —  b),  con 
a,b  G  C,  a  yé  b.  Entonces  Np  es  conjugada  con  la  aplicación  z 2  mediante  la  transformada  de 
Móbius  M(z)  =  (z  —  a)/ (z  —  b).  Además  J(Np )  es  una  circunferencia  en  la  esfera  compleja 
que  pasa  por  el  punto  del  infinito,  o  equivalentemente,  J (Np)  es  la  recta  que  equidista  de  los 
puntos  a  y  b  en  el  plano  complejo. 

Demostración.  Se  puede  comprobar  por  sustitución  directa  que  R(z)  =  MoNpoM~l{z)  =  z2, 
aunque  el  cálculo  puede  resultar  un  poco  tedioso.  Veamos  una  demostración  alternativa  que 
puede  resultar  más  interesante  desde  el  punto  de  vista  matemático.  Lo  primero,  es  observar 
que 

Np(a )  =  a  M(a)  =  0 

Np(b)  =  b  M(b )  =  oo 

Np(  oo)  =  oo  M(  oo)  =  1. 
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Entonces,  se  tiene  que: 

R  :  z 
0 

oo 

1 


M~1(z)  ->  Np(M-\z))  ->  M{Np{M~\z))) 

a  — >  a  — >  0 

b  — >  b  — >  ex) 

oo  — >  oo  — >  1. 


i?(^)  es  una  aplicación  racional  de  grado  2  (como  Np(z))  que  fija  el  0,  el  oo  y  el  1.  Además, 
R'(z)  =  M\Np(M-\z)))N'p(M-\z))(M-')\z) 

_  M'{Np(M-\z)))N'v{M-\z )) 

M,(M~1(z)) 

Como  M'(z )  =  (a  —  6)/(z  —  á)2  y  Ad(z)  =  Lp(z )  =  p(z)p'' (z)  /  p' (z)2 ,  se  tiene  que 
^(°)  =  - u/(aj - —  -^p(a)  —  0  (Af(a)^O). 

Por  otra  parte,  como  M'(b )  =  oo, 

«y,  ,  M'(Np(x))NÍ(z)  ,,  (X-6)2  A7„  ,  ,,  1 

i?  (oo)  =  lnn - — —  - =  lim  — —  - —NJx)  =  lnn  .  =  oo. 

x^b  M'(x)  X^b  ( Np(x )  —  6) 2  P  Np(x) 

Así,  R(z)  tiene  una  raíz  doble  en  z  —  0,  luego  es  de  la  forma 


R(z)  = 


az2  +  /3z  +  7 

Como  R(oo)  =  oo,  a  =  0.  Como  R'(oo)  =  oo  y 

D//  ^  ,,  2z(f3z  +  7)  —  fiz2  1 

z->°°  (pz  +  7  y  p 

se  sigue  que  P  =  0.  Por  último,  como  -R(l)  =  1,  7  =  1  y  R(z)  =  z2. 


□ 


4.4.2.  El  método  de  Newton  para  polinomios  cúbicos  con  raíces 
múltiples 

Una  ligera  variante  del  estudio  realizado  en  la  sección  anterior  nos  permite  obtener  algu¬ 
nas  conclusiones  acerca  del  comportamiento  del  método  de  Newton  cuando  aparecen  raíces 
múltiples.  Lo  primero  observación  general  que  podemos  hacer  es  que  cuando  se  aplica  el  mé¬ 
todo  de  Newton  a  un  polinomio  de  grado  d,  la  función  de  iteración  resultante  tiene  grado  d 
cuando  las  raíces  son  simples.  Sin  embargo,  cuando  las  raíces  son  múltiples,  el  grado  de  la 
función  de  iteración  es  menor  estrictamente  que  d.  Consideramos  en  esta  sección  el  caso  del 
polinomio 


p(z)  =  (z  —  a)2(z  —  b). 


(4.16) 


4.4.  Propiedades  del  método  de  Newton  en  C 


153 


En  este  caso,  particularmente  sencillo,  el  polinomio  tiene  una  raíz  doble  y  una  raíz  simple. 
Analizaremos  las  dinámicas  del  método  de  Newton  y  estudiaremos  cómo  son  las  cuencas  de 
atracción  de  las  raíces  de  p.  Veremos  que  el  comportamiento  es  totalmente  distinto  a  cuando 
las  raíces  del  polinomio  son  simples. 

4 


2 


0 


-2 


Figura  4.3:  Cuencas  de  atracción  de  las  raíces,  z  =  —  1  y  z  =  1  para  el  método  de  Newton 
aplicado  al  polinomio  p(z )  =  (z  —  1  )2(z  +  1). 


En  primer  lugar,  mediante  cambios  de  variable  afines,  el  estudio  del  método  de  Newton 
aplicado  a  polinomios  de  la  forma  (4.16),  puede  reducirse  al  estudio  del  polinomio  p(z)  = 
(z  —  1  )2(z  +  1).  En  este  caso,  la  función  de  iteración  del  método  de  Newton  es  de  la  forma 


Np(z) 


2z2  +  z  +  1 

r+üi 


Esta  función  tiene  un  punto  fijo  superatractor  en  z  =  —  1  y  un  punto  fijo  atractor  en  z  —  1, 
con  multiplicador  asociado  1/2.  Además,  el  punto  del  infinito  es  un  punto  fijo  repulsor  con 
multiplicador  asociado  3/2.  En  la  figura  4.3  se  muestran  las  cuencas  de  atracción  de  las  dos 
raíces,  z  —  —1  y  z  —  1.  Como  se  puede  apreciar  en  la  figura,  la  cuenca  de  atracción  de  la 
raíz  múltiple,  en  este  caso,  z  —  1,  «invade»  la  cuenca  de  atracción  de  la  otra  raíz,  z  =  —  1. 
En  este  caso,  la  presencia  de  dos  raíces,  una  múltiple  y  otra  simple,  hace  que  se  pierda  la 
simetría  a  la  que  hace  referencia  el  teorema  4.45. 

Por  otra  parte,  para  el  caso  de  polinomios  con  raíces  múltiples  de  la  forma  (4.16)  la 
iteración  de  Newton,  Np(z),  es  conjugada  mediante  la  transformada  de  Móbius  M(z)  = 
(z  —  a)/ (z  —  b )  con  la  aplicación  z(z  +  l)/2  definida  en  el  plano  complejo  ampliado  C.  El 
correspondiente  conjunto  de  Julia  se  muestra  en  la  figura  4.4. 
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-2-10  l  -2-10  1  2 

Figura  4.4:  Cuencas  de  atraccción  asociadas  a  las  funciones  de  iteración  z(z-\-l)/2  y  z2  —  3/4, 
relacionadas  respectivamente  con  el  método  de  Newton  y  el  método  de  Newton  para  raíces 
múltiples. 


Si  se  conoce  la  multiplicidad  m  de  la  raíz  a  aproximar,  el  conocido  como  método  de 
Newton  para  raíces  múltiples, 

Nm(z)  =  z  -  m^\-  (4.17) 

p'(z) 

tiene  la  ventaja  de  que  recupera  el  orden  de  convergencia  cuadrático  al  aproximar  la  raíz 
múltiple.  El  estudio  de  la  dinámica  del  método  (4.17)  para  polinomios  de  la  forma  (4.16)  lo 
realizó  Gilbert  [55].  En  ese  trabajo,  se  prueba  que  la  correspondiente  función  de  iteración 
para  polinomios  de  la  forma  (4.16)  es 


N2(z)  =  z  -  2 


P(z) 

P'(z) 


z2  +  az  —  2  ab 
3  z  —  a  —  2b 


(4.18) 


Esta  función  racional  es  conjugada  con  la  aplicación  z2  —  3/4  mediante  la  transformada  de 


Móbius 


M(z) 


3z  +  a  —  Ab 
2(z  —  a) 


El  comportamiento  dinámico  de  la  función  polinómica  z2  —  3/4  es  bien  conocido  (véase  [16], 
por  ejemplo).  En  el  segundo  gráfico  de  la  figura  4.4  se  muestra  el  conjunto  de  Julia  para 
z2  —  3/4,  que  es  la  frontera  de  la  región  de  negro.  Nótese  que  en  este  caso,  las  raíces  ay  b  del 
polinomio  (4.16)  se  transforman  por  M  en  los  puntos 


M(a )  =  oo,  M(b ) 


Estos  dos  puntos  oo  y  — 1/2,  junto  con  el  punto  3/2,  son  los  puntos  fijos  del  polinomio  z2  —  3/4. 
oo  es  un  punto  fijo  superatractor,  —1/2  es  un  punto  fijo  indiferente  y  3/2  es  un  punto  fijo 
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repulsor.  Deshaciendo  los  cambios  se  concluye  que  el  método  de  Newton  para  raíces  múltiples 
(4.18)  ha  transformado  la  raíz  múltiple  a  en  un  punto  fijo  super atractor.  Como  contrapartida, 
la  otra  raíz,  6,  pasa  a  ser  un  punto  fijo  indiferente.  Por  último  oo  es  un  punto  fijo  repulsor 
para  (4.18). 

El  segundo  gráfico  de  la  figura  4.4  muestra  la  cuenca  de  atracción  de  oo  como  punto  fijo  de 
z2  —  3/4.  Los  puntos  de  la  región  de  negro  convergen  al  punto  fijo  indiferente  —1/2,  aunque, 
en  este  caso  la  convergencia  es  extremadamente  lenta. 

Otra  variante  del  método  de  Newton  para  ecuaciones  con  raíces  múltiples  viene  dada  por 


Ñp(z)  =  z 


J _ P(z) 

Lp(z)  p'(z)  ’ 


Lp(z)  — 


P(z)p"(z) 


(4.19) 


Ñp(z)  se  obtiene  aplicando  el  método  de  Newton  a  la  función  racional  p(z)/p'(z).  Para  po¬ 
linomios  de  la  forma  (4.16),  el  método  4.19  es  conjugado  con  la  aplicación  —  z2  mediante  la 
transformada  de  Mobius  M(z)  —  (z  —  a)/(z  —  b ).  Por  lo  tanto,  su  conjunto  de  Julia  es  la 
circunferencia  unidad  y  sus  dinámicas  son  similares  al  método  de  Newton  para  raíces  simples 
(véase  el  teorema  4.45). 


4.4.3.  El  método  de  Newton  para  polinomios  cúbicos 


Sea  p(z)  =  a3z3  +  a2z2  +  a\Z  +  a0  un  polinomio  cúbico  con  sus  tres  raíces  a,  b  y  c  distintas, 
las  cuales  suponemos  ordenadas  por  sus  módulos,  es  decir,  0  <  |a|  <  \b\  <  |c|. 

Pongamos  T~l(z)  =  az  +  ¡3,  y  encontremos  los  coeficientes  a  y  (3  de  modo  que  T~l(a)  =  0 
y  T  l{c )  =  1.  Tenemos  entonces  que  a  =  ^  y  ¡3  —  —  por  lo  tanto,  T_1(z)  = 
y  en  consecuencia  T(z)  =  (c  —  a)z  +  a.  Aplicando  esta  transformación  T  en  el  teorema  de 
reescalamiento  anterior  (teorema  4.23),  obtenemos 


q(z)  =  p  o  T(z)  =  p((c  —  a)z  +  a)  =  (c  —  a)3z  ( z  —  - — —  )  (z  —  1). 

V  c  —  al 


Haciendo,  A  =  (c  —  a)3  y  p  —  (b  —  a)/ (c  —  a),  obtenemos 


q(z)  =  \3z(z-l)(z-  p). 


Por  otra  parte,  es  fácil  ver  que  si  f(z)  =  ag(z),  entonces  Nf(z)  =  Ng(z). 
En  consecuencia,  haciendo 


pp(z)  =  z{z-l){z-p) 


(4.20) 


y  denotando  por  Np  a  su  correspondiente  función  de  iteración  para  el  método  de  Newton, 


z{z-l){z-p) 

3  z2  —  2  pz  —  2z  +  p’ 


(4.21) 


tenemos  probado  el  siguiente  resultado,  que  establece  que  para  conocer  la  dinámica  de  la 
método  de  Newton  de  un  polinomio  cúbico  debemos  conocer  la  dinámica  de  la  función  racional 
Np,  donde  p  G  C  es  un  parámetro. 
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Teorema  4.46.  Sea  p(z)  un  polinomio  cúbico  con  sus  tres  raíces  distintas.  Entonces,  Np  es 
conjugado  topológicamente  con  Np  definida  en  (j-21). 


Notemos  que  el  caso  p  =  0  se  reduce  al  estudio  del  método  de  Newton  aplicado  al  polino¬ 
mio  po(z)  =  z2(z  —  1)  =  z3  —  z2.  Este  polinomio  tiene  en  0  una  raíz  doble  y  su  comportamiento 
dinámico  es  similar  al  del  polinomio  que  aparece  en  la  figura  4.3. 

En  este  caso,  tenemos 

N  (  x  =  „  _  -  (p  +  1)¿2  +  pz  =  2¿3  -  {p  +  1  )z2 

p  3z2  —  2(p  +  l)z  +  p  3z2  —  2(p  +  l)z  +  p 


y 

(¿3  -  (p  +  1  )z2  +  pz)(6z  -  2 (p  +  1) 
p^’  {3z2  —  2(p  +  l)z  +  p)2 

Un  estudio  sobre  de  familia  fue  hecho  por  Curry,  Garnett  y  Sullivan  [37]. 

En  este  caso,  N'{z )  =  0  si  y  sólo  si  pp(z)  =  0  o  p"p{z)  =  0.  En  consecuencia,  el  conjunto 
de  puntos  críticos  de  Np  está  formado  por  las  tres  raíces  de  pp  junto  con  el  punto  z  = 

Los  puntos  críticos  de  Np  que  no  son  raíces  de  pp  se  llaman  puntos  críticos  libres. 

El  estudio  de  las  órbitas  de  los  puntos  críticos  libres  da  mucha  información  sobre  el 
comportamiento  dinámico  de  un  método.  En  concreto,  para  determinar  si  existen  órbitas 
periódicas  atractoras  para  Np ,  distintas  de  las  raíces  de  pp,  debemos  responder  a  la  pregunta 
siguiente:  ¿para  qué  valores  de  p.  la  órbita  del  punto  crítico  libre, 


es  una  órbita  periódica  atractora? 

En  la  pregunta  anterior  debemos  excluir  los  casos  p  =  — l,p  =  2yp  =  l/2  para  los  cuales 
el  punto  fijo  extraño  coincide  con  alguna  de  las  raíces  del  polinomio  pp. 

Lina  manera  de  responder  a  la  pregunta  anterior  es  colorear  el  espacio  de  parámetros 
p  G  C  de  acuerdo  a  la  convergencia  del  punto  crítico  libre  (p  +  l)/3,  tal  y  como  se  hace  en  la 
figura  4.5.  Si  la  órbita  de  (p+ 1)/3  converge  a  0,  1  o  p,  el  valor  del  correspondiente  parámetro 
p  se  colorea  en  amarillo,  cian  o  magenta  respectivamente. 

Como  se  aprecia  en  la  figura  4.5,  existen  regiones  abiertas  en  el  espacio  de  parámetros  tales 
que,  si  p  pertenece  a  estas  regiones  entonces  existen  regiones  abiertas  en  el  plano  complejo 
de  forma  que  Np(z)  definida  en  (4.21)  no  converge  a  ninguna  de  las  raíces  del  polinomio 
pp(z)  definido  en  (4.20).  Las  regiones  coloreadas  en  negro  en  el  espacio  de  parámetros  están 
formadas  por  los  valores  de  p  para  los  cuales  la  sucesión 


n: 


va  a  parar  a  un  ciclo  atractor. 
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0.4  0.45  0.5  0.55  0.6 


Figura  4.5:  Representación  gráfica  del  espacio  de  parámetros  asociado  a  la  función  de  itera¬ 
ción  Np(z)  definida  en  (4.21)  y  asociada  a  los  polinomios  de  la  forma  pp(z)  =  z{z  —  1  )(z  —  p). 

La  figura  de  la  derecha  muestra  una  ampliación  de  una  zona  negra  en  la  que  se  aprecia  un 
conjunto  de  tipo  Mandelbrot. 

La  parametrización  de  los  polinomios  cúbicos  considerada  en  (4.20)  no  es  la  única.  Otra 
parametrización  muy  habitual  (véase  [125])  es  la  siguiente: 

pP{z)  =  (z2 -l){z- p),  peC.  (4.22) 

La  correspondiente  función  de  iteración  para  el  método  de  Newton  es 

2z3 


NA*)  = 


pz  —  p 


(4.23) 


3z2  -2pz-l 

En  este  caso,  el  punto  crítico  libre  asociado  al  método  de  Newton  es  la  única  raíz  de 
Pp(z)  =  0,  es  decir,  z  =  p/ 3.  Podemos  realizar  una  reflexiones  similares  al  caso  anterior  y 
colorear  el  espacio  de  parámetros  conforme  a  la  convergencia  del  punto  crítico  libre,  amarillo, 
dan  o  magenta  si  la  órbita  de  /i/3  converge  a  p,  1  o  —  1  respectivamente,  tal  y  como  se  muestra 
en  la  figura  4.6.  De  nuevo,  las  regiones  coloreadas  en  negro  en  el  espacio  de  parámetros  están 
formadas  por  los  valores  de  p  para  los  cuales  la  sucesión 

K  (- 

M  V3 

va  a  parar  a  un  ciclo  atractor. 

Por  último,  consideramos  otra  parametrización  muy  conocida  (véase  [118]),  como  es  la 
siguiente: 

P\{z)  =  z3  +  (A  —  1  )z  —  A,  A  e  C.  (4.24) 

Denotamos  N\(z)  a  la  función  de  iteración  del  método  de  Newton  aplicado  a  los  polinomios 
de  la  forma  (4.24): 


Nx{z)  = 


2z3  +  A 
3z2  +  A  -  1 ' 


(4.25) 
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Figura  4.6:  Representación  gráfica  del  espacio  de  parámetros  asociado  a  la  función  de  itera¬ 
ción  del  método  de  Newton  para  los  polinomios  (4.22).  La  figura  de  la  derecha  muestra  una 
ampliación  de  una  zona  negra  en  la  que  se  aprecia  un  conjunto  de  tipo  Mandelbrot  similar 
al  de  la  figura  4.5. 

En  este  caso,  el  punto  crítico  libre  asociado  al  método  de  Newton  es  la  única  raíz  de  p'j(z)  =  0, 
es  decir,  z  =  0. 

Las  regiones  coloreadas  en  negro  en  el  espacio  de  parámetros  de  la  figura  4.7  están  for¬ 
madas  por  los  valores  de  A  para  los  cuales  la  sucesión 

Nm 

va  a  parar  a  un  ciclo  atractor. 

La  figura  4.8  muestra  las  cuencas  de  atracción  del  método  de  Newton  para  un  polinomio 
P\(z)  definido  en  (4.24)  y  tomando  A  en  una  de  las  zonas  negras  del  espacio  de  parámetros. 
Como  vemos  aparecen  «agujeros  negros»  originados  por  la  presencia  de  ciclos  atractores.  En 
concreto,  en  este  caso  se  tiene  que  la  órbita  del  punto  crítico  libre  z  =  0  es  atraída  por  el 
3-ciclo 

{1.02169  -  1.04136*,  0.620968  -  0.632698Í,  -0.00204529  +  0.00527748*}. 


4.4.4.  El  método  de  Newton  para  polinomios  de  grados  4  y  5 

Como  hemos  visto  en  el  apartado  anterior,  el  estudio  dinámico  del  método  de  Newton 
aplicado  a  polinomios  de  tercer  grado  se  reduce  al  estudio  de  una  función  racional  dependiente 
de  un  parámetro,  en  concreto  (4.21).  Evidentemente,  al  aumentar  el  grado  de  los  polinomios 
también  lo  hará  el  número  de  parámetros  involucrados  en  la  correspondiente  función  racional 
asociada  al  método  de  Newton. 
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Figura  4.7:  Representación  gráfica  del  espacio  de  parámetros  asociado  a  la  función  de  ite¬ 
ración  N\(z)  definida  en  (4.25)  y  la  correspondiente  ampliación  mostrando  un  conjunto  de 
tipo  Mandelbrot. 


Figura  4.8:  Cuencas  de  atracción  del  método  de  Newton  aplicado  al  polinomio  p\(z)  = 
z3  +  (A  —  l)z  —  A  con  A  =  1.02  +  0.96¿  y  una  ampliación  de  la  zona  negra  que  se  genera 
entorno  al  punto  crítico  libre  z  =  0. 

No  obstante,  existen  algunas  manipulaciones  algebraicas  que  permiten  reducir  el  número 
de  coeficientes  que  aparecen  en  una  ecuación  polinómica.  En  concreto,  la  conocida  como 
transformación  de  Tschirnhaus  ([44])  permite  transformar  la  ecuación 

z  -\~  an-\z  -)-■■■  d"  Q*\Z  -f-  cto  =  0,  ?i  >  2, 

en  otra  ecuación  polinómica  donde  no  aparecen  los  términos  en  zn_1  y  zn~2,  es  decir, 

zn  +  ^n— 3 zn  3  +  ■  ■  ■  +  b±z  +  &o  =  0)  n  >  2. 
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El  resultado  original  de  Tschirnhaus  apareció  publicado  en  Acta  Eruditorum  en  1683.  Más 
adelante,  en  1786,  E.  S.  Bring  probó  que  una  ecuación  polinómica  de  grado  5  puede  reducirse 
a  una  del  tipo 

z5  +  az  +  b  =  0. 

Finalmente,  en  1834  G.  B.  Jerrard  demostró  que  en  ecuaciones  polinómicas  de  grado  mayor 
que  3  se  puede  encontrar  una  transformación  de  Tschirnhaus  en  la  que  no  aparecen  los 
términos  en  zn -1,  zn~2  y  zn~3,  es  decir,  del  tipo 

z  +  cn—4.z  T  ■  ■  ■  T  C\Z  +  cq  =  0,  n  í>  3. 


Estas  transformaciones  se  basan  en  complicadas  manipulaciones  algebraicas  sobre  las 
raíces  de  la  ecuación  (véase  [155]).  Estas  manipulaciones  no  conservan  las  propiedades  diná¬ 
micas.  En  efecto,  como  se  vio  en  el  ejemplo  (4.5),  el  método  de  Newton  aplicado  al  polinomio 
z3  —  2z  +  2  tiene  un  2-ciclo  atractor  de  la  forma  {0, 1}.  Dicho  polinomio  puede  ser  transfor¬ 
mado  en  uno  de  la  forma  p(z)  =  z3  —  X3,  X  E  C,  por  la  correspondiente  transformación  de 
Tschirnhaus.  A  su  vez,  el  método  de  Newton  aplicado  al  polinomio  anterior, 


Np(z)  =  z 


X3  2  z3  +  A3 


3z2  3 z2 

es  conjugado  topológicamente,  mediante  la  aplicación  afín  h(z) 
Newton  aplicado  al  polinomio  q(z)  =  z3  —  1, 

~3  -  1  2z3  +  1 


Nq(z )  =  Z 


3z2 


3  z2 


z/X,  con  el  método  de 


En  efecto, 

o-.3  i  \3 

h  o  Np(z)  =  3A^2  =  Nq  o  h(z). 

Pero  como  se  aprecia  en  las  figuras  4.1  y  4.9,  el  comportamiento  dinámico  del  método  de 
Newton  aplicado  a  los  polinomios  q(z)  =  z3  —  1  y  z3  —  2z  +  2  es  muy  diferente.  De  hecho, 
en  el  primer  caso  no  aparecen  n-ciclos  atractores  con  n  >  2,  luego  su  dinámica  no  puede  ser 
equivalente  a  la  del  método  de  Newton  aplicado  al  polinomio  z3  —  2z  +  2,  que  sí  presenta  un 
2-ciclo  atractor. 

Para  ver  que  Np(z)  no  tiene  2-ciclos  atractores,  calculamos  los  puntos  fijos  de 


16z9  +  51z6  +  12z3  +  2 
9z2  (2z3  +  l)2 


Tenemos  que  N2(z)  =  z  si  y  sólo  si  z3  =  1  o  2CD6  +  5z3  +  2  =  0.  Los  2-ciclos  aparecen  entre 
las  raíces  j  —  1, . . . ,  6  de  la  segunda  ecuación.  Pero  en  todas  ellas  se  cumple  que 


!+&)!«  2.45  >1. 


luego  ningún  2-ciclo  es  atractor. 


4.5.  Algoritmos  generalmente  convergentes 


161 


Las  expresiones  simplificadas  de  polinomios  de  cuarto  y  quinto  grado  que  aparecen  después 
de  aplicar  las  transformaciones  de  Tschirnhaus  o  de  Bring-Jerrard,  motivan  el  estudio  del 
método  de  Newton  para  ecuaciones  de  la  forma  z4  +  az  +  b4  =  0  o  z5  +  az  +  b5  =  0  como 
casos  particulares  de  ecuaciones  polinómicas  de  cuarto  y  quinto  grado  respectivamente.  En 
concreto,  para  la  ecuación  de  quinto  grado  anterior  puede  verse  un  estudio  detallado  de  la 
dinámica  del  método  de  Newton  en  [8]. 

4.5.  Algoritmos  generalmente  convergentes 

En  1985,  Steve  Smale  [139]  planteó  la  siguiente  cuestión  sobre  la  existencia  de  algoritmos 
para  encontrar  los  ceros  de  un  polinomio  ¿Existen  métodos  iterativos  (punto  a  punto)  dados 
por  una  aplicación  racional  que  sean  convergentes  a  las  raíces  de  un  polinomio  para  casi  todo 
punto  de  partida  y  para  casi  todo  polinomio?  Podemos  pensar  en  la  medida  de  Lebesgue  tanto 
en  el  campo  complejo  como  en  el  espacio  Cd+1  de  los  coeficientes  de  un  polinomio  de  grado  d 
para  definir  el  concepto  de  para  casi  todo  en  el  sentido  de  para  todos  los  puntos  excepto  un 
conjunto  de  medida  cero. 

Dos  años  más  tarde,  Curtis  McMullen  [99]  encontró  la  respuesta  a  la  pregunta  anterior. 
En  concreto,  McMullen  probó  lo  siguiente: 

1.  No  existen  algoritmos  generalmente  convergentes  para  polinomios  de  grado  mayor  o 
igual  que  cuatro. 

2.  Caracterizó  los  algoritmos  generalmente  convergentes  para  polinomios  de  grados  dos  y 
tres. 

Vamos  a  analizar  los  resultados  dados  por  McMullen.  Para  ello,  necesitamos  las  siguientes 
definiciones: 

Definición  4.12.  Sean  P<¿  el  conjunto  de  polinomios  de  grado  d  y  7 Zatf¡  el  conjunto  de 
funciones  racionales  de  grado  k  definidas  de  C  en  C.  Diremos  que  R  G  7 Zatk  es  convergente 
para  p  G  P<¿  si  la  sucesión  {Rn(z)}n> 0  converge  a  una  raíz  de  p  para  casi  todo  z  G  C. 

Un  método  iterativo  dado  por  R  es  generalmente  convergente  (para  polinomios  de  grado  d) 
si  Rp  es  convergente  para  casi  todo  p  G  P<j. 

Ya  hemos  visto  que  el  método  de  Newton  es  generalmente  convergente  para  polinomios  de 
grado  dos.  También  es  conocido  desde  los  tiempos  de  Caylcy  [16]  que  el  método  de  Newton 
no  es  generalmente  convergente  para  polinomios  de  grado  tres  o  superior,  ya  que  se  pueden 
encontrar  polinomios  con  n-ciclos  atractores,  n  >  2  y  en  general  polinomios  para  los  cuales  el 
método  de  Newton  no  converge  a  ninguna  de  las  raíces  para  puntos  de  partida  pertenecientes 
a  un  conjunto  de  medida  positiva,  A  continuación  presentamos  algunos  ejemplos  en  este 
sentido. 
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Figura  4.9:  Cuencas  de  atracción  del  método  de  Newton  aplicado  a  p(z)  =  z3  —  2z  +  2  y 
a  p(z)  =  3z5  —  10 z3  +  23z.  En  ambos  casos  se  observa  la  aparición  de  «agujeros  negros» 
provocados  por  la  presencia  de  ciclos  atractores. 


Ejemplo  4.7  (Smale,  [139]).  Sea  p(z)  =  z3  —  2z  +  2.  Entonces  {0, 1}  es  una  órbita  periódica 
superatractora  para  el  método  de  Newton  Np. 


En  efecto,  en  este  caso,  tenemos  que 


Np(z) 


2z 3  -  2 
3¿2  -  2’ 


Y  Nfa) 


z(6z3  -  12 z  +  12) 
(3¿2  -  2)2 


de  donde  obtenemos  que  N'  {z)  =  0  si  y  sólo  si  z  =  0  o  p(z)  =  0  (raíces  de  p),  y 
como  p(0)  =  2  tenemos  que  z  =  0  es  un  punto  crítico  libre.  Notemos  ahora  que 
iVp(O)  =  1  y  iVp(l)  =  0,  luego  {0, 1}  es  una  órbita  periódica  de  Np  y 


(A^)'(0)  =  JV¿(JVp(0))  •  7V¿( 0)  =  JVJ(1)  .  N'r( 0)  =  0, 


por  lo  tanto  {0, 1}  es  una  órbita  periódica  superatractora  de  Np.  En  consecuencia, 
existe  un  conjunto  abierto  U  de  puntos  entorno  al  punto  z  —  0  tal  que  si  z$  G  U, 
el  método  de  Newton  aplicado  al  polinomio  p(z)  =  z3  —  2z  +  2  no  converge  a 
ninguna  raíz  del  mismo.  De  hecho,  no  es  el  único  conjunto  con  esta  propiedad. 
Este  y  otros  conjuntos  de  puntos  de  partida  para  los  cuales  no  hay  convergencia 
a  ninguna  raíz  se  muestran  como  «agujeros  negros»  en  la  figura  4.9. 


Ejemplo  4.8  (Barna,  [11]).  Sea  p(z)  =  3 z5  —  10z3  +  23¿.  Entonces  {1,-1}  es  una  órbita 
periódica  superatractora  para  el  método  de  Newton  Np. 


En  este  caso,  se  tiene  que  los  puntos  críticos  libres  son  las  raíces  de  p"(z)  que  no 
son  raíces  de  p(z),  es  decir,  z  =  1  y  z  =  —1.  Como  iVp(l)  =  —1,  Np(— 1)  =  1  y 
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Np(  1)  =  Np(—1)  =  O,  se  tiene  que  {1,  —1}  es  un  2-ciclo  superatractor  de  Np.  En 
consecuencia,  existe  un  conjunto  abierto  U  de  puntos  entorno  al  punto  z  =  1  tal 
que  si  z0  £  U,  el  método  de  Newton  aplicado  al  polinomio  p(z)  =  3 z5  — 1CD3  +  23z 
no  converge  a  ninguna  raíz  del  mismo.  De  hecho,  no  es  el  único  conjunto  con  esta 
propiedad.  Éste  y  otros  conjuntos  de  puntos  de  partida  para  los  cuales  no  hay 
convergencia  a  ninguna  raíz  se  muestran  como  «agujeros  negros»  en  la  figura  4.9. 

Ejemplo  4.9  (Barna,  [11]).  Seap(z)  =  z4—6z2  —  ll.  Entonces  {1,  —1}  es  una  órbita  periódica 
superatractora  para  el  método  de  Newton  Np. 

En  este  caso, 

.  .  z4  -  6z2  -  11  3z4  -  6z2  +  11 

Np^  ~Z~  4z 3  -  12 z  ~  4z 3  -  12z  ' 

De  aquí,  Np(  1)  =  — 1  y  Np(—1)  =  1,  luego  {1,  —1}  es  una  órbita  periódica  de  pe¬ 
ríodo  2  para  Np,  que  además  es  superatractora  ya  que  (N2)'(l)  =  Np(— l)Np(l)  = 

0. 

De  hecho  tenemos  más. 

Teorema  4.47  (Smale,  [139]).  El  método  de  Newton  no  es  generalmente  convergente. 

Demostración.  Sea  p(z)  =  J2j=oajz:i  un  polinomio  de  grado  d  >  3.  Fijemos  «o  =  1,  ai  =  — 1 
y  a-2  =  0.  Tenemos  entonces  que  p(z)  =  1  —  z  +  a3^3  +  •  •  •  +  a<iZd.  Entonces 

p  (^)  —  — 1  T  3a$z  T  4a4^3  T  ■  ■  ■  T  da¿z  , 


y 


p"{z)  =  6 a^z  +  12a4^2  +  •  •  •  +  d(d  —  1  )adZd  2. 


Como  p(0)  =  1,  p'(0)  =  — 1  y  p"{ 0)  =  0  se  tiene  que  Np( 0)  =  1  y  Np(Q)  =  0.  Además,  si 
Ad(l)  yé  oo  entonces  (N2)'( 0)  =  i\d(l)i\d(0)  =  0. 

Como  Np(z)  =  i  tenemos  Np( 0)  =  1  y  Np(Q)  =  0,  y  si  Np(l)  ^  oo  entonces 

(N2)'( 0)  =  %(Np(0))Nl(0)  =  AÚ(1)AÚ(0)  =  0.  Luego,  si  Np(  1)  =  0  y  AC(1)  jé  oo,  se  tiene 
que  0  es  un  punto  periódico,  de  período  2,  superatractor  para  Np. 

Ahora  bien,  teniendo  en  cuenta  que 

nr  /  \ _ _  1  —  z  +  a^z3  +  •  •  •  +  adZd 

p  —  1  +  3  a3z2  +  4o4^3  +  •  •  •  +  dadZd~l 

se  tiene  que  Np(  1)  =  0  si,  y  sólo  si 


—  1  T  2a3  T  4a4  T  •  •  •  T  ( ( I  —  l)a^  —  0. 


(4.26) 


La  condición  Np(l)  jé  oo  se  satisface  si  p'(  1)  jé  0,  es  decir,  si 

—  1  T  3a3  T-  4a4  T  •  •  •  T  dad  7^  (4.27) 


Estas  condiciones  se  satisfacen  en  un  conjunto  abierto  y  denso  de  un  hiperplano  de 
{(a3,  a4, . . . ,  a¿)  :  a¿  G  C}  =  Cd_2.  Lo  que  termina  la  prueba.  □ 
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Por  ejemplo,  tomando  d  —  3  en  el  teorema  anterior,  tenemos  el  polinomio 

,  .  lo 

P{z)  =  2  z-z  +  1. 

Notemos  que  este  polinomio  es  un  múltiplo  del  polinomio  que  aparece  en  el  ejemplo  4.7.  Por 
lo  tanto,  la  función  de  iteración  obtenida  aplicando  el  método  de  Newton  a  ambos  polinomios 
es  la  misma. 

Para  d  —  4  las  ecuaciones  (4.26)  y  (4.27)  nos  dan 

j  — 1  +  2a3  T  3g¡4  —  0, 

— 1  T  3as  +  4q<4  ^4  0. 

De  (4.26)  obtenemos  04  =  (1  —  2a3)/3  y  reemplazando  en  (4.27)  obtenemos  a3  ^  — 1.  Por 
lo  tanto  las  ecuaciones  (4.26)  y  (4.27)  valen  para  a3  7^  — 1.  Haciendo  A  =  a3  obtenemos  la 
siguiente  familia  uniparámetrica  de  polinomios  de  grado  4: 

P\(z)  =  l  —  z  +  Xz3  H - - — z  , 

o  de  forma  más  simple 

qx{z)  =  3-3^  +  3A^s  +  (1  -2\)z‘i  (4.28) 

la  cual  tiene  a  {0, 1}  como  órbita  periódica  superatractora.  La  figura  4.10  muestra  las  cuencas 
de  atracción  del  método  de  Newton  aplicado  a  uno  de  estos  polinomios,  en  concreto  para 
A  =  1.  Las  regiones  en  negro  corresponden  a  la  cuenca  de  atracción  de  la  órbita  periódica  de 
período  2,  {0, 1}. 

De  forma  más  genérica,  podemos  encontrar  una  familia  de  polinomios  de  grado  n  >  3  tales 
que  el  método  de  Newton  asociado,  Np(z),  tiene  a  a  =  {0, 1}  como  un  2-ciclo  super atractor, 
El  siguiente  resultado  da  una  manera  constructiva  de  calcular  dichos  polinomios. 

Teorema  4.48  (Kalantari,  [73]).  Para  cada  n  >  3,  el  método  de  Newton  no  es  generalmente 
convergente  para  el  polinomio 

p{z)  =  zn  —  (n  —  1  )z  +  n  —  1.  (4.29) 

Demostración.  Seguimos  las  ideas  de  Smale  [139].  Consideramos  un  polinomio  de  grado  n  >  3 
de  la  forma  p(z)  =  zn  +  az  +  b  para  el  cual  imponemos  que  a  =  {0, 1}  sea  un  2-ciclo 
superatractor,  es  decir,  imponemos 

Np( 0)  =  1,  Np(  1)  =  0,  AÚ(0)  =  0  y  N'p(  1)  ^  oo 

Tenemos  Np( 0)  =  0,  y  por  la  regla  de  la  cadena 

(Np)'(0)  =  N'p(Np(  0))  =  A7(l)iV;(0)  =  0. 


(4.30) 
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Figura  4.10:  Cuencas  de  atracción  del  método  de  Newton  aplicado  al  polinomio  qi(z)  = 

3  —  3z  +  3 z3  —  z4  definido  en  (4.28)  cuando  A  =  1. 

Ahora,  como 

,  .  p(z)  zn  +  az  +  b  (n  —  l)zn  —  b 

p  p{z)  nzn~l  +  a  nzn~l  +  a 

se  tiene  que  Np( 0)  =  —b/a.  De  la  condición  Np( 0)  =  1,  se  sigue  que  b  =  —a.  Por  otra 
parte,  como  Np(  1)  =  0,  nos  queda  (n  —  1)  —  b  =  0,  de  donde  b  =  —a  —  n  —  1.  Por  lo 
tanto  p(z)  =  zn  —  (n  —  1  )z  +  n  —  1.  Finalmente,  dado  que  N'p(z)  =  se  sigue  que 

(^)'(O)  =0.  □ 

La  figura  4.11  muestra  las  cuencas  de  atracción  del  método  de  Newton  aplicado  a  uno  de 
los  polinomios  definidos  en  (4.29),  en  concreto  para  n  =  4.  Las  regiones  en  negro  corresponden 
a  la  cuenca  de  atracción  de  la  órbita  periódica  superatractora  {0, 1}. 

La  siguiente  pregunta  que  nos  planteamos  es  si  podemos  construir  polinomios  para  los 
cuales  el  método  de  Newton  asociado  tenga  un  ciclo  atractor,  indiferente  parabólico,  un  disco 
de  Siegel  o  un  punto  de  Cremer. 

Para  realizar  este  estudio,  consideremos  un  polinomio  de  grado  3,  p(z)  =  ^3  +  a2^2  +  ai2:  + 
a0,  e  impongamos  las  condiciones 

(1)  Np( 0)  =  1; 


(2)  iVp(l)  =  0; 

(3)  N¿(0)N¿(1)  =  A,  con  A  G  C. 
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Figura  4.11:  Cuencas  de  atracción  del  método  de  Newton  aplicado  al  polinomio  p(z)  = 
zA  —  3z  +  3  definido  en  (4.29)  para  n  =  4. 

Las  condiciones  Np(0)  =  1  y  Np(l)  =  0  son  equivalentes  a 

P(0)  =  MU  =  | 

p\ o)  y  j/(  1) 

respectivamente.  La  condición  sobre  la  derivada  Np(Q)  ■  Np(  1)  =  A  se  puede  escribir 
p(Q)p"(Q)  PWÍ1)  =  P{ 0)  P"( 0)  P(l)  P'\l)  =  > 

p'( O)2  '  p'( l)2  p'( 0)  p’( 0)  p\  1)  2/(1) 

y,  por  tanto, 

_^(0)^(1)  =  A 
p'(0)  p’{ i) 

Ahora,  para  el  polinomio  p(z)  =  z3  +  02¿2  +  a\Z  +  ao,  tenemos 

_1  _  P(0)  =  «o 

p'(0)  ai’ 

es  decir,  ai  =  — a0.  Ahora  bien, como 

1  p(l)  1  +  02  +  ai  +  ao  l  +  a2 
y/( 1)  3  +  2a2  +  ai  3  +  2a2  —  Oo 

se  sigue  que  a2  =  a0  —  2.  Llamando  a  =  a0  nos  quedan  las  condiciones  ai  =  —a  y  a2  =  a-2. 
Por  lo  tanto  el  polinomio  buscado  es 


pQ(z)  =  z2  +  (a  —  2  )z2  —  az  +  a. 
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Evaluando  la  condición 

,  P"(  0)  p"(  1) 

P'(0)  '  p'(l) 

obtenemos  que 


^(Q  ~  2)(Q:  +  1)  =  _A 

—«(o;  —  1 

De  aquí  se  deduce  que  a  debe  satisfacer  la  ecuación  cuadrática 

(4  —  X)a2  —  (4  —  A)a  —  8  =  0, 


cuya  solución,  para  A  ^  4,  es 


1 

a  —  - 
2 


=  v  1  ±  \  1  + 


32 

4  -  A 


En  definitiva,  hemos  probado  el  siguiente  resultado. 

Teorema  4.49.  Sea  A  G  C  —  {4}.  Entonces  el  polinomio 

p(z)  =  z3  +  (o  —  2  )z2  —  az  +  a 


con 


5 


satisface  que  {0, 1}  es  un  2-ciclo  para  Np(z),  con  multiplicador  asociado  (N£)'( 0)  =  A. 


Como  aplicación  de  este  resultado,  podemos  podemos  construir  polinomios  para  los  cuales 
el  método  de  Newton  asociado  tenga  un  ciclo  atractor  o  un  ciclo  indiferente  parabólico.  En 
concreto,  tomando  A  =  0yo  =  2se  tiene  que  el  método  de  Newton  aplicado  al  polinomio 
z3  —  2z  +  2  tiene  un  2-ciclo  superatractor  en  {0, 1}  (véase  también  el  ejemplo  4.7).  Por  otra 
parte,  tomando  A  =  1  y  a  =  (l  +  35/ 3^)  /2,  la  aplicación  del  teorema  anterior  nos  conduce 

a  un  2-ciclo  indiferente  para  el  método  de  Newton.  El  comportamiento  dinámico  en  este  caso 
es  similar  al  del  ejemplo  4.7),  junto  a  las  cuencas  de  atracción  de  las  tres  raíces  aparecen  las 
cuencas  de  atracción  del  2-ciclo.  La  diferencia  es  que  la  convergencia  hacia  el  2-ciclo  en  el 
caso  indiferente  parabólico  es  mucho  más  lenta  que  en  el  caso  atractor.  El  comportamiento  en 
los  casos  restantes  (discos  de  Siegel  o  puntos  de  Crerner)  es  bastante  más  complejo.  El  lector 
interesado  puede  consultar  resultados  más  precisos  sobre  la  dinámica  alrededor  de  estos  ciclos 
parabólicos  en  [26]  o  [102], 

Lina  vez  vistos  varios  ejemplos  que  ponen  de  manifiesto  que  el  método  de  Newton  no  es 
generalmente  convergente  para  polinomios  de  grado  mayor  o  igual  que  3,  pasamos  a  enunciar 
los  resultados  principales  de  la  teoría  desarrollada  por  McMullen. 


Teorema  4.50  (McMullen,  [99]).  Sea  T  un  algoritmo  generalmente  convergente  para  poli¬ 
nomios  de  grado  d,  en  el  sentido  de  la  definición  4.12.  Entonces  Tp  y  Tq  son  conjugados  por 
una  transformada  de  Móbius  para  casi  todo  p,  q  G  P^. 
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Demostración.  La  demostración  está  basada  en  el  teorema  de  Thnrston  sobre  puntos  críticos 
de  aplicaciones  racionales  y  en  el  concepto  de  rigidez  de  una  familia  de  aplicaciones  racionales 
estable  [99,  Tilia.  2.2]:  o  bien  todos  sus  miembros  son  conjugados  por  una  transformada  de 
Móbius,  o  bien  las  órbitas  de  los  puntos  críticos  son  finitas.  Pensemos  en  el  método  de  Newton, 
para  el  cual, 


AÍM  = 


pMp" 


p'(z)2 

La  clave  está  en  analizar  los  puntos  críticos  que  no  son  raíces  de  p ,  es  decir,  los  puntos  tales 
que  p"(z)  =  0  (puntos  de  inflexión).  Esta  es  la  idea  que  les  permite  a  Roberts  y  Horgan- 
Kobelski  [125]  encontrar  «polinomios  malos»  para  el  método  de  Newton.  En  concreto,  para 
cada  n  >2  encuentran  un  valor  del  parámetro  Xn  tal  que  el  polinomio  (z2  —  l)(z  —  Xn)  tiene 
un  n-ciclo  atractor.  □ 


Corolario  4.51  ([99,  Tma.  1.1]).  No  existen  métodos  iterativos  generalmente  convergentes 
para  polinomios  de  grado  mayor  o  igual  que  4- 

Demostración.  Supongamos  que  T  es  un  algoritmo  generalmente  convergente  para  P<¿.  Sean 
p,  q  G  P d,  d  >  4,  con  todas  sus  raíces  simples.  Entonces,  Tp  y  Tq  son  conjugados  por  una 
transformada  de  Móbius  M : 

Tp  o  M  =  M  o  Tq. 

Sea  s  una  raíz  de  q.  Entonces  s  es  un  punto  fijo  atractor  de  Tq,  Tq(s )  —  s  y  r  —  M(s )  es 
un  punto  fijo  atractor  de  Tp.  Por  la  definición  de  algoritmo  generalmente  convergente,  r  es 
una  raíz  de  p  (si  Tfi(z)  converge  a  un  punto  distinto  de  una  raíz,  entonces  no  puede  ser 
generalmente  convergente) . 

Por  lo  tanto  M  transforma  las  raíces  de  q  en  las  raíces  de  p.  Dadas  dos  ternas  ordenadas 
{a,  b,  c}  y  {a',  b',  c'}  existe  una  y  sólo  una  transformada  de  Móbius  que  manda  {a,  6,  c}  en 
{a',  b',  c'}.  Pero  no  existen  transformadas  de  Móbius  que  manda  {ai, . . . ,  a¿}  en  {aj, . . . ,  a'd} 
para  d  >  4.  Esto  prueba  que  no  puede  existir  un  algoritmo  generalmente  convergente  para 
d  >  4.  □ 


En  consecuencia,  sólo  puede  haber  algoritmos  generalmente  convergentes  para  polinomios 
de  grados  dos  y  tres.  McMullen  también  caracterizó  cómo  tienen  que  ser  dichos  algoritmos. 
Para  ello,  necesitaremos  la  siguiente  definición: 

Definición  4.13.  Dada  una  aplicación  racional  T,  definimos  el  centralizador  de  T,  C(T ) 
como  el  grupo  de  las  transformadas  de  Móbius  que  conmutan  con  T . 

Corolario  4.52  (Algoritmos  generalmente  convergentes  para  polinomios  de  grado  2,  [99, 
Tma.  1.1]).  Un  método  iterativo  generalmente  convergente  para  polinomios  de  grado  2  se 
obtiene  determinando  una  aplicación  racional  T  tal  que: 

1.  T  es  convergente  para  el  polinomio  z2  —  1. 
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2.  El  centralizador  C(T )  contiene  a  la  transformada  de  Móbius  que  permuta  las  raíces 
cuadradas  de  la  unidad,  es  decir,  z  — >  — z 

El  algoritmo  es  entonces  Tp  =  APT A”1  donde  Ap  es  una  transformación  afín  que  manda  las 
raíces  cuadradas  de  la  unidad  en  las  raíces  del  polinomio  p. 

Corolario  4.53  (Algoritmos  generalmente  convergentes  para  polinomios  de  grado  3,  [99, 
Tina.  1.1]).  Un  método  iterativo  generalmente  convergente  para  polinomios  de  grado  3  se 
obtiene  determinando  una  aplicación  racional  T  tal  que: 

1.  T  es  convergente  para  el  polinomio  z3  —  1. 

2.  El  centralizador  C(T )  contiene  a  las  transformadas  de  Móbius  que  permuta  las  raíces 
cúbicas  de  la  unidad. 

El  algoritmo  es  entonces  Tp  =  MpTM~l  donde  Mp  es  una  transformada  de  Móbius  que 
manda  las  raíces  cúbicas  de  la  unidad  en  las  raíces  del  polinomio  p. 


4.5.1.  Algoritmos  generalmente  convergentes  para  polinomios  de 
segundo  grado 

Vamos  a  usar  el  Corolario  4.52  para  determinar  la  forma  de  los  algoritmos  generalmente 
convergentes  para  polinomios  de  segundo  grado.  Dentro  de  estos  distinguiremos  una  clase  es¬ 
pecial  que  llamaremos  superconvergente  y  estará  formada  por  los  algoritmos  Tp  cuyos  puntos 
críticos  son  también  puntos  fijos  y,  por  tanto,  coinciden  con  las  raíces  de  p. 

Comenzamos  buscando  algoritmos  superconvergentes  dados  por  una  función  racional  de 
segundo  grado: 

z2  +  az  +  b 


T(z)  = 


(c,d,e)  /  (0,0,0). 


cz2  +  dz  +  e  ’ 

Las  condiciones  del  corolario  4.52  son  T(  1)  =  1,  T(— 1)  =  —1,  T'{  1)  =  0,  T'{— 1)  =  0  y 
T(—z)  =  —T(z).  De  aquí  deducimos  que  a  =  c  =  e  =  0,  b  =  1  y  d  =  2,  con  lo  que 

rji/  \  Z2  +  1  ^  -  1 

T(Z)  =—  =  Z~  — ’ 

que  no  es  otra  cosa  que  el  método  de  Newton  aplicado  al  polinomio  z2  —  1. 

Sean  ahora  p(z)  =  (z  —  a)(z  •—  b),  a  /  b ,  Ap(z)  =  a  +  (b  —  a)(l  —  z)/2  la  aplicación  afín 
que  manda  1  -»  a  y  -1  -»  6,  Entonces, 

ab  —  z2 


Tp{z)  —  ApTAp 


-i, 


z  = 


a  +  b  —  2z 


o  equivalentemente, 


TM  = pfA. 

pyz) 


Así,  el  método  de  Newton  es  el  único  algoritmo  racional  de  segundo  grado  que  es  supercon¬ 
vergente  para  polinomios  de  grado  2. 
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4.5.2.  Algoritmos  generalmente  convergentes  para  polinomios  de 
tercer  grado 

Buscarnos  la  función  racional  T  de  menor  grado  qne  nos  proporcione  un  algoritmo  super- 
convergente  para  polinomios  de  tercer  grado.  Sean  u>k  =  exp(2/c7ri/3),  k  —  0,1,2  las  raíces 
cúbicas  de  la  unidad.  De  acnerdo  con  el  corolario  4.53,  T  tiene  qne  cumplir  T(ujk )  =  u>k, 
T'(oük)  =  0,  k  =  0, 1,2.  Además  T  debe  conmutar  con  el  conjunto  de  transformadas  de  Mó- 
bius  qne  permutan  las  raíces  cúbicas  de  la  unidad.  Este  conjunto  es  el  grupo  generado  por 
Mi(z)  =  1  /z  y  M2(z)  =  lú\Z.  En  principio,  hay  ocho  condiciones  por  lo  que  parece  insuficien¬ 
te  partir  de  una  función  racional  de  tercer  grado  (siete  incógnitas,  teniendo  en  cuenta  que 
podemos  normalizar).  Así  que  partimos  de 


T(z)  = 


Z 4  -j-  d$Z3  -)-  0,2 Z2  "P  d\Z  O.Q 


b^z4  +  b3z3  +  b2z2  +  biz  +  b0 ' 

Como  T(l/z)  =  1/T(z)}  b0  =  1,  íq  =  a3,  b2  =  a2,  b3  =  di  y  64  =  a0.  Además,  T(u>iz)  =  UiT(z) 
implica  que 


u>iz4  +  CL3Z0  +  a2cj\z1  +  <2iu>iz  +  do 
doOJlZ4  +  di  Z3  +  d2(jJ\Z2  +  dsLViZ  +  1 

por  lo  que  a0  =  a3  =  d2  =  0  y  entonces 

T(z)  = 


lo\Z4  +  a3cui  z3  +  d2u>iz2  +  diu>i  z  +  do  uq 
do  z4  +  oi^3  +  d2z2  +  a3z  +  1 


z4  +  d\Z 


di  z3  +  1 

Con  esto  se  garantiza  además  que  T{ujk)  =  u)k,  k  =  0,1,2.  Falta  determinar  ai  para  que 
T'(oük)  —  0,  k  —  0, 1,  2.  Las  tres  ecuaciones  conducen  a  un  único  valor  di  =  2,  por  lo  que 

=  »(»■  +  2) 

1  1  2z3  +  1  ' 

Este  algoritmo  T  fue  encontrado  por  McMullen  [99].  Se  puede  comprobar  que  el  orden 
de  convergencia  de  este  algoritmo  es  tres.  Además,  T  coincide  con  el  método  de  Halley  (2.7) 
cuando  se  aplica  a  p(z)  =  z3  —  1.  En  efecto, 

2  \  p(z)  3 z3  z3  —  1 


Hp(z)  z 


Lp(z) 


=  z 


I  p'(z) 
z(z3  +  2  z) 


2z3  +  l  3  z2 
=  T(z). 


2z3  +  1  2^3  +  l 

La  tentación  ahora  es  extrapolar  esta  fórmula  a  un  polinomio  cualquiera  y  pensar  que  el 
método  de  Halley  y  el  algoritmo  de  McMullen  coinciden  para  cualquier  polinomio  de  grado 
tres.  Pero  sabemos  que  el  método  de  Halley  no  es  generalmente  convergente  para  polinomios 
de  tercer  grado.  Por  ejemplo  [82],  sea  p(z)  =  2¿3  +  z  —  3,  entonces 

12^5  -  2¿3  +  36^2  +  3 


Hp(z)  = 


24  M  +  6z2  +  18^  +  1 
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Cuadro  4.1:  Iteraciones  del  método  de  Halley  aplicado  al  polinomio  p(z)  =  2 z3  +  z  —  3  para 
zo  =  —1.7.  Se  aprecia  la  presencia  de  un  2-ciclo  atractor. 


Zo 

-1.7 

Z4 

-1.707110 

Zi 

-0.284376 

z5 

-0.292898 

Z2 

-1.707130 

z% 

-1.707110 

z3 

-0.292918 

Z7 

-0.292894 

y  para  valores  iniciales  cercanos  a  Zq  =  — 1.7  las  órbitas  son  atraídas  por  un  2-ciclo  (véanse 
la  figura  4.12  y  el  cuadro  4.1). 

Luego,  en  general,  el  algoritmo  de  McMullen  no  puede  coincidir  con  el  método  de  Halley. 
Veamos,  por  tanto,  cómo  es  el  algoritmo  de  McMullen. 


Figura  4.12:  Cuencas  de  atraccción  para  el  método  de  Halley,  Hp(z),  aplicado  a  p(z)  = 

2 z3  +  z  —  3.  Los  círculos  negros  están  en  la  cuenca  de  atracción  de  un  ciclo  atractor  no 
asociado  a  ninguna  de  las  raíces  de  p. 

Dado  un  polinomio  de  tercer  grado  z3  +  a2z2  +  a\Z  +  a0,  el  cambio  de  variable  afín 
z  —  x  —  a2/3  nos  permite  transformarlo  en  uno  de  la  forma 

x3  +  ax  +  6, 

con 

a 2  aia2  2al 

a  =  ai-j,  b  =  d0  —  +  — • 

Además,  si  (  ^  0  es  una  raíz  de  x3  +  ax  +  b,  el  cambio  x  =  (uj  nos  permite  escribir  la  ecuación 

pc{u)  =  lo3  +  (c  —  1)uj  —  c  =  0,  c  G  C.  (4-31) 

Observemos  que  como  (3  +  a(  +  b  =  0,  a/£2  +  b/(3  =  — 1.  Si  llamamos  b/(3  =  — c,  entonces 

a/C 2  =  c  -  1. 
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Para  el  desarrollo  teórico  posterior  consideraremos  polinomios  de  la  forma  (4.31).  Las 
raíces  de  estos  polinomios  son: 

,  ,  _-i  +  ^r^4ó  x 

—  L  M  — - 2 - >  A2  “ - g - ' 

Con  esta  particular  parametrización  de  los  polinomios  de  tercer  orden,  1  es  siempre  una  raíz 
y  la  suma  de  las  tres  es  cero.  Salvo  para  los  casos  c  —  1/4  y  c  =  —2,  las  tres  raíces  son 
distintas.  Supondremos  a  partir  de  ahora  que  las  tres  raíces  son  distintas  (esto  no  afecta  al 
estudio  de  la  convergencia  general,  pues  dejamos  de  considerar  un  conjunto  de  medida  cero 
en  el  espacio  de  los  polinomios). 

Para  cada  polinomio  pc,  el  algoritmo  de  McMullen  es  entonces 

Tc(z)  =  McoT  o  M~1(z) 


donde  Mc  es  una  transformada  de  Móbius  que  manda  las  raíces  cúbicas  de  la  unidad  a  las 
raíces  de  pc,  X ¿,  i  =  0, 1,  2. 

Los  puntos  fijos  de  T  son  cn0,  íü2,  0  e  oo.  Observemos  además  que 

2 (z3  -  l)2 


T'(z)  = 


(1  +  2z3)2  ’ 


por  lo  que  las  raíces  cúbicas  de  la  unidad  son  puntos  críticos  de  segundo  orden  (también 
anulan  la  segunda  derivada)  de  T. 

Como  Tc  o  Mc  =  Mc  o  T,  los  puntos  fijos  de  Tc  son  Mc( 0),  Mc( oo)  y  Mc( ujk),  es  decir, 
Mc( 0),  Mc{ oo)  y  Afc. 

Sea  r  un  punto  fijo  de  T  tal  que  T'(r)  =  0.  Entonces,  T'c(Mc(t ))  =  0.  En  efecto, 


Como  M'c(t)  ¿  0.  Te(Mc( t))  =  0. 

Si  además,  T"(t)  =  0,  entonces  también  T"(Mc{r ))  =  0.  En  efecto, 


y'(Mc(r))M'(r)2  +  ^(Mc(r))M''(r)  =  M''(r)T'(r)  +  M'(t)T"(t)  =  0. 


Como  T'(Mc(r))  =  0  y  M'(t)  #  0,  T"(Mc(r))  =  0. 

En  resumen, 

Pc(z)(z  -  Mc(0))(z  -  Mc( oo)) 


Taz)  =  z  - 


r  c(z) 


donde  rc(z)  es  un  polinomio  de  grado  4  a  determinar.  Operando  se  llega  a 


(z  —  Mc(0))(z  —  Mc(oo))  =  z2 


3c 


c  — 


c  —  1 
3 


3(c  —  l)^2  —  9  cz  —  (c  —  l)2 
3(c-l) 


Además,  rc(z)  =  ( az  +  (3)pc(z )  +  (pcQcYiz),  donde  qc{z)  =  3 (c  —  l)^2  —  9cz  —  (c  —  l)2.  De 
aquí  se  calcula  a  exigiendo  que  el  algoritmo  es  de  grado  4:  a  =  —12 (c  —  1).  Para  el  cálculo 
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de  [3  podemos  tener  en  cuenta  que  T"(  1)  =  T"( Ai)  =  T"(X2)  =  0.  Las  tres  ecuaciones  nos 
conducen  a  la  misma  solución  ¡3  =  18c. 

En  definitiva  el  algoritmo  de  McMullen  para  un  polinomio  de  la  forma  4.31  es 

T(z)  =  z _ (s3  +  (c  -  l)z  -  c)(3(c  -  l)z2  -  9cz  -  (c  -  l)2) 

c  (3c  —  1  )z4  —  18c¿3  —  6(c  —  1  )2z2  +  6c(c  —  l)z  +  1  —  3c  —  6c2  —  c3 


Para  un  polinomio  de  la  forma  p(z )  =  z3  +  az  +  b  McMullen  [99,  Prop.1.2]  probó  que  el 
algoritmo  tiene  la  forma 


Tp(z)  =  z 


( z 3  +  az  +  b)(3az2  +  9  bz  —  a2) 
3 az4  +  18 bz3  —  6 a2z2  —  6 abz  —  9 b2  - 


(4.32) 


Como  vemos,  el  algoritmo  se  expresa  en  función  de  los  coeficientes  de  p  y,  en  principio, 
no  admite  una  expresión  en  términos  de  p  y  sus  derivadas.  Además,  se  puede  observar  que  no 
coincide  con  el  método  de  Halley  aplicado  a  p(z)  =  z3  +  az  +  b.  En  la  figura  4.13  se  muestran 
los  dominios  de  atracción  para  los  algoritmos  de  Halley  y  McMullen  aplicados  al  polinomio 
r5  +  (2 i  -  1  )z  -  2%. 


Figura  4.13:  Algoritmos  de  McMullen  y  de  Halley  para  el  polinomio  z3  +  (2 i  —  1  )z  —  2 i. 

El  propio  McMullen  propone  una  forma  alternativa  de  construir  el  algoritmo  (4.32)  como 
resultado  de  aplicar  el  método  de  Newton  a  la  función  racional 

z3  +  az  +  b 

^  Z  3 az2  +  9 bz  —  a 2  ’ 

4.5.3.  Otros  algoritmos  generalmente  convergentes  para  polino¬ 
mios  de  tercer  grado 

Aplicando  el  Corolario  4.53,  Jane  Hawkins  [61]  caracterizó  las  funciones  racionales  que 
generan  un  algoritmo  globalmente  convergente  para  polinomios  cúbicos. 
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Teorema  4.54  (Hawkins,  [61,  Tina.  3.1]).  Si  R  genera  un  algoritmo  globalmente  convergente 
para  polinomios  cúbicos,  entonces  existen  constantes  ao,cq, . . .  ,ak,  con  ao  y  ak  distintas  de 
cero,  tales  que 

_  z(ao  +  a\Z3  +  •  •  •  +  akz3k ) 
ak  +  ak-\z3  H - h  a0z3k  ' 

Demostración.  Supongamos  que  R(z)  =  p(z)/q(z),  siendo  p  y  q  dos  polinomios  coprimos  (sin 
factores  comunes).  La  demostración  se  sigue  utilizando  únicamente  que  R(u>z)  =  loR(z)  para 
u  una  raíz  cúbica  de  la  unidad  (distinta  de  1),  que  R{l/z)  =  1  /R(z)  y  que  z  =  1  es  un  punto 
fijo  de  R.  El  resto  de  condiciones  del  Corolario  4.53  servirán,  en  su  caso,  para  determinar  los 
coeficientes  üq,  ...  ,ak-  □ 


Este  resultado  nos  indica  que  no  podemos  construir  algoritmos  generalmente  convergente 
a  partir  de  funciones  racionales  de  cualquier  grado.  Por  ejemplo,  para  polinomios  cúbicos, 
no  existirán  algoritmos  generalmente  convergentes  de  grados  5  ó  6.  Algunos  ejemplos  de 
algoritmos  globalmente  convergentes  para  polinomios  cúbicos  son  los  siguientes: 


R*(z) 


z(2  +  z3) 

1  +  2z3  ’ 


z(U  +  35z3  +  5  ze) 

R^Z’  ~  5  +  35^3  +  14^  ’ 

_  z(7  +  42z3  +  3°26  +  2z9) 

10^  “  2  +  30z3  +  42z6  +  7z9 

El  algoritmo  R4  es  el  que  hemos  calculado  para  obtener  el  algoritmo  de  McMullen.  Se  puede 


comprobar  que  el  orden  de  convergencia  de  este  algoritmo  es  tres.  Rj  y  Rio  fueron  encontrados 
por  Hawkins.  R-j  es  el  único  algoritmo  de  grado  7  cuyo  orden  de  convergencia  es  mayor  que  3. 
De  hecho,  tiene  orden  de  convergencia  5.  Rw  es  el  único  algoritmo  de  grado  10  y  orden  de 
convergencia  7. 


4.5.4.  Conjunto  de  Julia  universal  para  el  algoritmo  de  McMullen 

Para  cualquier  polinomio  cúbico  pc  de  la  forma  (4.31),  con  sus  raíces  distintas,  ya  hemos 
visto  que  el  algoritmo  de  McMullen  Tc  es  conjugado  con 

T(z)  = 

V  ;  l  +  2¿3 

Consideramos  ahora  la  transformada  de  Móbius 

ya  -  (2  +  ¿pypz 

W  e2.¡/32  _  1 

que  transforma  las  raíces  cúbicas  de  la  unidad  en  —1,  1  e  oo  y  definimos 

(3  +  6  z2  —  zA) 


Tm(z)  =  M  oT  o  M~  (z)  = 


8z 
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Figura  4.14:  Conjunto  de  Julia  universal  para  un  polinomio  de  tercer  grado,  obtenido  a  partir 
de  la  aplicación  racional  (3  +  6 z2  —  z4)/(8z). 

El  conjunto  de  Julia  para  T*  se  muestra  en  la  figura  4.14  y  lo  llamamos  conjunto  de  Julia 
universal  [82]  para  el  método  de  McMullen.  Por  tanto,  para  casi  todo  polinomio  cúbico  con 
las  tres  raíces  distintas,  el  correspondiente  conjunto  de  Julia  para  el  algoritmo  de  McMu¬ 
llen  es  como  el  de  la  figura  anterior.  Ambos  son  conformemente  equivalentes  mediante  una 
transformación  de  Móbius. 


4 

2 

0 

-2 

-4 

-4  -2  0  2  4 

Figura  4.15:  Conjunto  de  Julia  para  el  algoritmo  de  McMullen  aplicado  a  z3  —  1. 

La  única  excepción  es  el  polinomio  z3  —  1.  En  este  caso,  el  conjunto  de  Julia  tiene  una 
forma  diferente  (figura  4.15).  Esto  es  debido  a  que  en  este  caso,  para  c  =  1,  T\(z)  =  T(z), 
luego  oo  es  un  punto  fijo.  Sin  embargo  para  c  ^  1,  el  punto  fijo  del  infinito  va  a  parar  a 

9c  ±  i/sic2  +  12(c  —  l)3 
Mc( oo)  = - —  - — - 7^  oo. 
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En  consecuencia,  el  oo  deja  de  ser  un  punto  fijo.  Lo  normal  entonces  es  que  las  cuencas  de 
atracción  estén  acotadas  para  dos  de  las  tres  raíces  de  pc,  resultando  una  figura  como  la  de 
la  figura  4.14,  salvo  un  factor  de  escala.  Esto  tiene  consecuencias  interesantes  desde  el  punto 
de  vista  numérico,  ya  que  lo  que  suele  ocurrir  es  que  oo  pertenezca  a  la  cuenca  de  atracción 
de  alguna  de  las  raíces  de  pc  y  para  puntos  de  partida  grandes  en  módulo  se  produzca  una 
convergencia  rápida  hacia  esa  raíz.  Sin  embargo,  como  es  sabido,  para  el  método  de  Newton 
la  convergencia  es  lineal  para  valores  grandes  de  \z\  y  para  el  método  de  Halley  y  para  puntos 
de  partida  grandes  en  módulo  se  podría  dar  la  convergencia  a  cualquiera  de  las  tres  raíces. 
En  el  cuadro  4.2  comparamos  la  convergencia  de  los  métodos  de  Newton,  Halley  y  McMullen 
para  el  polinomio  P2i(z)  =  z3  +  (2 i  —  1  )z  —  2 i  para  distintos  puntos  de  partida.  Las  raíces  de 
P2i  son  aproximadamente  1,  —1.5643  +  0.93956Í  y  0.5643  —  0.93956b 

Para  terminar  este  capítulo  estudiaremos  algunas  limitaciones  que  tienen  los  algoritmos 
iterativos  para  aproximar  raíces  de  polinomios  en  el  plano  complejo.  Comenzamos  con  la 
siguiente  definición. 

Definición  4.14.  Dado  un  polinomio  p(z)  de  grado  d  >  2.  Una  función  racional  Tp(z), 
de  grado  k(d),  definida  en  términos  de  z,  p(z)  y  sus  derivadas  se  llama  una  función  de 
iteración  para  tal  polinomio  si,  cada  raíz  de  p(z)  es  un  punto  fijo  (super) atractor  de  Tp(z ). 
Si  esta  propiedad  vale  para  todo  polinomio  p(z)  de  grado  d,  decimos  que  la  función  racional 
T  definida  por  T(p(z))  =  Tp(z )  es  un  algoritmo  puramente  iterativo. 

Por  ejemplo,  el  método  de  Newton 

N  :  PÍZ)  np(z)  =z~  ^ 
es  un  algoritmo  puramente  iterativo. 

Lina  pregunta  inmediata  es  ¿cuán  bueno  es  un  método  iterativo  para  aproximar  las  raíces 
de  un  polinomio?,  o  más  específicamente,  ¿el  método  iterativo  en  cuestión  converge  para  casi 
toda  condición  inicial?  Esto  nos  lleva  a  la  siguiente  teorema,  que  fue  probado  por  Barna  para 
el  caso  especial  de  polinomios  con  todas  sus  raíces  reales. 

Teorema  4.55  (Barna,  [12]).  Sea  p(z)  un  polinomio  con  todos  sus  raíces  reales,  entonces  los 
puntos  de  inflexión  de  p(z)  están  contenidos  en  las  cuencas  de  atracción  inmediatas  para  Np 
de  las  raíces  ■  ■  ■  ,Cd  de  p(z).  Además,  excepto  por  un  conjunto  de  Cantor  C  de  números 
reales,  cada  número  real  converge  por  iteraciones  por  Np  a  una  raíz  de  p(z). 

Para  el  método  de  Newton  aplicado  a  un  polinomio  cúbico,  este  puede  fallar  debido 
a  la  existencia  de  un  ciclo  atractor.  Como  ya  indicamos  el  método  de  Newton  aplicado 
a  polinomios  no  puede  tener  anillos  de  Hermán,  pues  su  conjunto  de  Julia  es  conexo,  y 
consecuentemente  toda  componente  de  Fatou  es  simplemente  conexa.  La  aparición  de  discos 
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Cuadro  4.2:  Métodos  de  Newton,  Halley  y  McMullen  para  P2i{z )  =  z3  +  (2 i  —  1  )z  —  2 i  y 
zq  =  1000  +  1007,  zq  =  —1000  +  100?'  y  zq  =  —100  —  1000?. 


n 

Newton 

Halley 

McMullen 

0 

1000  +  1007 

1000  +  1007 

1000  +  1007 

1 

666.667  +  66.6662? 

500  +  49.9991? 

-2.40531  +  1.20676? 

2 

444.445  +  44.4434? 

250.001  +  24.9978? 

-1.57506  +  0.937464Í 

3 

296.297  +  29.6279? 

125.002  +  12.4955? 

-1.56432  +  0.939565? 

19 

0.995525  -  0.0010387? 

1 

-1.56432  +  0.939565? 

20 

1.00002  -  0.0000074Í 

1 

-1.56432  +  0.939565? 

n 

Newton 

Halley 

McMullen 

0 

-1000  +  1007 

-1000  +  100? 

-1000  +  100? 

1 

— 666.66T  +  66.6662?' 

-500.  +  50.0008? 

-2.3935  +  1.19451? 

2 

-444.445  +  44.4454? 

-250.001  +  25.002? 

-1.57461  +  0.937299? 

3 

—296.297  +  29.6312? 

-125.003  +  12.5041? 

-1.56432  +  0.939565? 

19 

-1.5643  +  0.939569? 

-1.56432  +  0.939565? 

-1.56432  +  0.939565? 

20 

-1.56432  +  0.939565? 

-1.56432  +  0.939565? 

-1.56432  +  0.939565? 

n 

Newton 

Halley 

McMullen 

0 

-100  -  1000? 

-100  -  1000? 

-100  -  1000? 

1 

—66.6662  —  666.666? 

-49.9992  -  500? 

-2.40551  +  1.19343? 

2 

-44.4435  -  444.444? 

-24.998  -  249.999? 

-1.57489  +  0.937122? 

3 

-29.6281  -  296.295 

-12.4959  -  124.997? 

-1.56432  +  0.939565? 

19 

0.563728  -  0.937347? 

0.564322  -  0.939565? 

-1.56432  +  0.939565? 

20 

0.564326  -  0.93957? 

0.564322  -  0.939565? 

-1.56432  +  0.939565? 

de  Siegel  para  métodos  iterativos,  en  especial  para  el  método  de  Newton,  es  consecuencia  de 
un  resultado  de  McMullen  ([99],  [100]). 

Una  pregunta  que  surge  de  inmediato  es  ¿cómo  puede  fallar  una  función  de  iteración  para 
aproximar  raíces  para  dejar  de  ser  generalmente  convergente?  Sabemos  que  la  existencia  de 
ciclos  atractores  nos  lleva  a  una  explicación  de  la  pregunta  anterior,  notemos  que  la  existencia 
de  un  ciclo  atractor  para  un  elemento  p  G  P<¿,  conjunto  de  polinomios  de  grado  d,  implica  la 
existencia  de  una  vecindad  abierta  J\fp  de  p  en  P<¿,  de  modo  que  cada  q  G  Aíp  falla  a  converger 
por  la  existencia  de  un  ciclo  atractor  del  mismo  largo  que  el  de  p.  Pero  ¿es  ésta  la  única 
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forma  de  que  una  función  de  iteración  deje  de  ser  generalmente  convergente?  Imaginemos 
que  para  una  función  de  iteración  cuando  es  aplicada  a  un  polinomio,  el  conjunto  de  Julia 
obtenido  tiene  medida  positiva  (ya  sabemos  que  no  puede  tener  puntos  interiores),  entonces 
tal  función  de  iteración  fallaría  a  converger  sobre  un  conjunto  de  medida  positiva.  Esto  no 
implica  que  lo  mismo  ocurra  para  polinomios  próximos.  Para  ver  la  existencia  de  discos  de 
Siegcl,  argumentamos  como  sigue.  Si  {7a}a  es  una  familia  de  funciones  racionales  con  un 
ciclo  que  cambia  de  repulsor  a  atractor  cuando  A  varía,  entonces  este  ciclo  debe  contener  el 
centro  de  Siegel  para  algún  valor  del  parámetro  A. 

Para  una  función  de  iteración  Tp(z)  asociada  a  un  polinomio  p(z),  tenemos  el  siguiente 
resultado. 

Teorema  4.56.  Una  función  de  iteración  Tp(z )  asociada  a  un  polinomio  p(z)  es  generalmente 
convergente  si  y  sólo  si  el  conjunto  de  Julia  J ( Tp )  tiene  medida  de  Lebesgue  cero  y  para  todo 
z  G  óF{Tp)  se  tiene  que  orb+(z)  converge  a  una  raíz  de  p(z).  En  particular,  esto  significa 
que  no  existen  ciclos  de  componentes  de  Fatou  de  largo  mayor  o  igual  que  dos,  ya  sean 
(super) atractores,  parabólicos,  discos  de  Siegel  o  anillos  de  Hermán. 

Definición  4.15.  Decimos  que  un  punto  crítico  c  de  una  fwición  racional  R  es  preperiódico 
si  existe  un  menor  entero  positivo  algún  n  >  1,  tal  que  Rn(c )  está  sobre  un  p-ciclo.  Cuando 
p  =  1,  decimos  que  c  es  prefijo. 

Lo  anterior  significa  que  n  es  el  primer  entero  positivo,  tal  que  c  G  R~n(z0),  donde  z0  es 
un  punto  sobre  un  p-ciclo. 

Teorema  4.57  (McMullen,  [100]).  Sea  R  una  función  racional.  Supongamos  que  R  tiene  al 
menos  un  ciclo  atractor.  Si  todos  los  puntos  críticos  de  R  están  en  cuencas  de  atracción  de 
atractores  o  son  preperiódicos,  entonces  J ( R )  tiene  medida  de  Lebesgue  cero.  Además,  para 
todo  z  J ( R )  se  tiene  que  sus  iterados  por  R  convergen  a  un  ciclo  atractor. 

De  esto  deducimos  el  siguiente  resultado: 

Teorema  4.58.  Una  función  de  iteración  Tp(z )  asociada  a  un  polinomio  p(z)  es  generalmente 
convergente  si  sus  puntos  críticos  son  preperiódicos  o  convergen  a  una  raíz  de  p(z). 

Corolario  4.59.  Sea  Np(z)  el  método  de  Newton  asociado  a  un  polinomio  p(z) .  Si  las  raíces 
de  p"(z)  son  preperiódicas  o  convergen  a  una  raíz  de  p(z),  entonces  Np  es  generalmente 
convergente. 

El  siguiente  resultado  (teorema  1  en  [70])  nos  muestra  que  aún  cuando  el  método  de 
Newton  no  es  generalmente  convergente,  podemos  controlar  los  puntos  iniciales  de  modo 
a  que  siempre  tengamos  convergencia  a  una  raíz.  Comenzamos  introduciendo  la  siguiente 
notación.  Sea  Vd  el  espacio  de  polinomios  de  grado  d ,  normalizados  de  modo  que  todas  sus 
raíces  estén  en  el  disco  abierto  unitario  D  en  el  plano  complejo. 
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Teorema  4.60  (Hubbard,  Schleicher  y  Sutherland,  [70]).  Para  cada  d  >  2,  existe  un  conjunto 
S¿  consistiendo  de  a  lo  más  l.lldlog2  d  puntos  en  C,  con  la  propiedad  que  para  cada  polinomio 
p  G  Vd  y  cada  una  de  sus  rafees,  existe  un  punto  s  G  en  la  cuenca  de  atracción  de  la  raíz 
elegida.  Para  polinomios  cuyas  rafees  son  todas  reales,  existe  un  conjunto  análogo  S  con  a  lo 
más  1.3 d  puntos. 

Note  que  el  teorema  anterior  no  hace  que  el  método  de  Newton  sea  de  hecho  un  algoritmo, 
pues  fijada  una  raíz  £  de  un  polinomio  p  G  V¿  y  un  error  (tolerancia)  £  >  0,  no  se  tienen  cotas 
sobre  el  número  de  iterados  que  debemos  calcular  para  obtener  |£  —  zn\  <  e,  donde  zq  £  <Sd  lo 
escogemos  en  la  cuenca  de  atracción  de  £.  Este  problema  fue  resuelto  por  Schleicher  en  [134], 
donde  caracterizó  un  conjunto  de  condiciones  iniciales  eficientes. 

Teorema  4.61  (Schleicher,  [134]).  Dado  e  >  0,  para  cada  grado  d  existe  un  conjunto  finito 
de  condiciones  iniciales  Sd  C  C  conteniendo  cd(logd)2  puntos  con  la  siguiente  propiedad. 
Dado  p  G  entonces  para  cada  raíz  £  de  p(z),  existe  al  menos  un  punto  z  G  Sd  tal  que  las 
iteraciones  Nfi(z)  convergen  a  £.  Además,  el  número  de  iteraciones  requerido,  Me  de  modo 
que 

\NpIe(z)  -  £|  <  £ 

depende  polinomialmente  de  d  con  exponente  bajo.  El  conjunto  Sd  puede  ser  especificado 
explícitamente. 
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Sea  /  :  C  — >  C  una  función  entera,  es  decir,  una  función  holomorfa  sobre  todo  el  plano 
complejo.  El  método  de  Newton  asociado  a  /,  Nf,  es  una  función  meromorfa,  es  decir,  una 
función  holomorfa  en  todo  C  excepto  en  un  conjunto  de  puntos  aislados,  llamados  polos  de 
la  función.  La  función  Nf  :  C  — >  C  puede  ser  extendida  a  oo  como  una  función  racional  si 
y  sólo  si  /  tiene  la  forma  especial  f(z)  =  p(z)eq^z\  donde  p  y  q  son  polinomios  (véase  [129, 
proposición  2.11]).  Como  en  el  caso  de  funciones  racionales,  se  tiene  que  si  £  G  C  es  una  raíz 
de  multiplicidad  m  >  1  de  /,  entonces  iV/(£)  =  £  y  7V((£)  =  1  —  1/m,  y  recípromente,  cada 
punto  fijo  finito  de  Nf  es  atractor  y  una  raíz  de  /,  y  esto  de  hecho  caracteriza  las  aplicaciones 
de  Newton  de  funciones  enteras  (véase  [129,  proposición  2.8]). 

Teorema  4.62  (Rückert  y  Schleicher,  [129]).  Sea  N  :  C  — >  C  una  función  meromorfa.  Esta 
es  la  aplicación  de  Newton  de  una  función  entera  f  :  C  — >  C  si  y  sólo  si  para  cada  punto 
fijo  iV(£)  =  £  G  C,  existe  un  número  natural  rri  G  N  tal  que  iV'(£)  =  1  —  1/m.  En  este  caso, 
existe  una  constante  c  G  C  —  {0}  tal  que 

(iPrni 
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Dos  funciones  enteras  f  y  g  tienen  la  misma  aplicación  de  Newton  si  y  sólo  si  f  —  cg  para 
alguna  constante  c  G  C  —  {0}. 

Observemos,  por  el  teorema  anterior,  que  una  función  meromorfa  sin  puntos  fijos  es  au¬ 
tomáticamente  la  aplicación  de  Newton  de  una  función  entera  sin  ceros. 

Como  corolario,  se  tiene  la  caracterización  de  las  funciones  racionales  que  son  el  método 
de  Newton  de  algún  polinomio  complejo. 

Teorema  4.63.  Una  función  racional  R  :  C  — »  C  de  grado  d  >  2  es  la  aplicación  de  Newton 
de  un  polinomio  de  grado  al  menos  2  si  y  sólo  si  R( oo)  =  oo  y  para  todos  los  otros  puntos 
fijos  ai,  ,..,a¿  G  C,  existen  mi, . . . ,  rnfj  G  N  tal  que  R'iflf)  =  (m¿  —  1  )/m¿  <  1.  Entonces,  R 
es  el  método  de  Newton  aplicado  al  polinomio 

P(z)  =  aj[(z  -  aj)mj 

=i 

para  cualquier  número  complejo  a  ^  0. 

Note  que  no  hemos  considerado  el  caso  de  una  aplicación  racional  de  grado  1  en  el  teorema 
anterior,  esto  es  debido  al  siguiente  resultado. 

Teorema  4.64.  Sea  f  :  C  — >  C  una  función  entera  tal  que  su  función  de  Newton  tiene  sólo 
un  punto  fijo  atractor  f  G  C  con  cuenca  de  atracción  inmediata  U  —  C.  Entonces  existe  d  >  0 
y  a  G  C  tal  que  f(z )  =  a(z  —  tj)d. 

El  siguiente  resultado  clasifica  las  funciones  racionales  que  son  el  método  de  Newton  de 
funciones  enteras. 

Teorema  4.65  (Rückert  y  Schleicher,  [129]).  Sea  f  :  C  — >  C  una  función  entera.  Su  apli¬ 
cación  de  Newton  Nf  es  una  función  racional  si  y  sólo  si  existen  polinomios  p  y  q  tal  que  f 
tiene  la  forma  f  =  peq.  En  este  caso,  oo  es  un  punto  fijo  repulsor  o  parabólico. 

Más  precisamente,  sean  m,  n  >  0  los  grados  de  p  y  q,  respectivamente.  Si  n  —  0  y  m  >  2, 
entonces  oo  es  repulsor  con  multiplicador  Si  n  —  0  y  m  —  1,  entonces  Nf  es  constante. 
Si  n  >  0,  entonces  oo  es  parabólico  con  multiplicador  +1  y  multiplicidad  n  +  1  >2. 

Notemos  que  si  Nf  tiene  una  singularidad  esencial  en  oo,  entonces  la  sucesión  de  iterados 
no  está  definida  para  puntos  z  G  C  para  los  cuales  Nf(z)  =  oo  para  algún  n  G  N,  y  en  este 
caso,  z  G  J{Nf )  por  definición.  De  hecho,  J{Nf)  es  la  clausura  de  tales  puntos. 

Como  en  el  caso  de  las  funciones  racionales,  cuando  /  es  meromorfa,  siempre  se  tiene 
que  J(Nf)  es  no  vacío  (véase  [20,  teorema  3]).  Por  otra  parte  si  /  tiene  al  menos  una  raíz, 
entonces  J(N¡)  es  pequeño  en  el  sentido  que  es  nunca  denso  y  tiene  interior  vacío  (véase 
[20,  lema  3]).  En  este  caso,  aparte  de  las  clásicas  componentes  de  Fatou  que  existen  en  el 
caso  de  funciones  racionales,  aparece  una  componente  no  errante  más,  llamada  dominio  de 
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Baker ,  y  pueden  aparecer  otras  componentes  errantes.  Recordemos  que  U  es  una  componente 
errante  si  NJ(U)  D  Njn(U)  =  0,  para  todo  m  n.  Tenemos  el  siguiente  resultado  para  la 
clasificación  de  las  componentes  del  conjunto  de  Faton  fF(Nf),  que  podemos  encontrar,  por 
ejemplo  en  [20]. 

Teorema  4.66.  Sea  f  una  función  entera  y  Nf  la  función  de  iteración  del  método  de  Newton. 
Sea  U  una  componente  de  iF(Nf).  Entonces,  U  es  o  bien  errante  o  existe  k  e  N  y  una 
componente  periódica  V  de  fF{Nf)  tal  que  Nf(U)  C  V .  En  este  caso,  sea  p  >  1  minimal  tal 
que  N'f(V)  C  V ,  entonces  V  es  exactamente  de  uno  de  los  siguientes  tipos: 

1.  V  es  una  cuenca  de  atracción,  es  decir,  contiene  un  único  punto  periódico  atractor  z0 
de  período  p,  tal  que  Njp{z)  — >  zo  para  todo  z  G  V  cuando  n  — >  oo. 

2.  V  es  una  componente  parabólica,  esto  es,  dV  contiene  un  único  punto  periódico  para¬ 
bólico  zq  de  período  p  tal  que  Njp(z)  — >  zo  para  todo  z  G  V  cuando  n  — >  oo. 

3.  V  es  un  disco  de  Siegel,  es  decir,  Np\v  es  conformemente  conjugado  a  una  rotación 
irracional  del  disco  unitario. 

4 ■  V  es  un  anillo  de  Hermán,  esto  es,  Np \v  es  conformemente  conjugada  a  una  rotación 
irracional  de  un  anillo  de  módulo  finito. 

5.  V  es  un  dominio  de  Baker,  esto  es,  Np(z)  — >  oo  para  todo  z  e  V,  e  oo  es  una  singula¬ 
ridad  esencial  de  Nf. 

Notemos  que  en  los  casos  (2)  y  (3)  del  teorema  anterior  necesariamente  se  tiene  que  p  >  1. 

Además,  para  funciones  enteras,  se  tiene  el  siguiente  resultado  que  caracteriza  las  cuencas 
de  atracción  de  un  punto  fijo  atractor.  Su  demostración  puede  verse  también  en  [20]. 

Teorema  4.67.  Sea  f  :  C  — >  C  una  función  entera  no  constante.  Si  f  es  un  punto  fijo 
atractor  del  método  de  Newton  Nf,  entonces  su  cuenca  de  atracción  inmediata  es  simplemente 
conexa  y  no  acotada. 

Para  más  resultados  sobre  el  método  de  Newton  para  funciones  no  racionales,  en  especial 
funciones  enteras  y  meromorfas  en  el  plano  complejo,  recomendamos  al  lector  revisar  los 
artículos  [20],  [62],  [129]  y  las  referencias  que  allí  aparecen.  Para  finalizar  esta  sección  y, 
como  una  pequeña  muestra  de  lo  que  se  puede  hacer  en  este  campo,  mostramos  (figuras  4.16 
y  4.17)  las  cuencas  de  atracción  asociadas  al  método  de  Newton  aplicado  a  las  funciones 
f(z)  =  sen  z  y  f(z)  =  exp  z  —  1. 

En  el  caso  de  la  función  trigonométrica  la  función  de  iteración  es  Nf(z)  =  z  —  tgz.  La 
ecuación  sen  z  —  0  tiene  infinitas  soluciones  de  la  forma  z  =  km,  k  e  Z.  Las  regiones  pintadas 
con  el  mismo  color  en  la  figura  4.16  están  formadas  por  puntos  de  partida  para  los  cuales 
el  método  de  Newton  converge  a  la  misma  raíz  de  la  ecuación  sen¿  =  0.  En  concreto,  los 
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puntos  en  amarillo  convergen  a  —  n,  los  puntos  en  cian  convergen  a  0  y  los  puntos  en  magenta 
convergen  a  n.  Las  regiones  en  negro  están  formadas  o  bien  por  puntos  para  los  cuales  el 
método  de  Newton  no  converge  a  ninguna  raíz  o  bien  por  puntos  que  convergen  a  cualquiera 
de  las  otras  tres  raíces  consideradas. 

4 


2 

0 

-2 


-4 

-4  -2  0  2  4 

Figura  4.16:  A  la  izquierda  se  muestran  las  cuencas  de  atracción  de  la  función  Nf(z)  =  z—tg  z 

y  a  la  derecha  un  detalle  de  dicha  figura. 

Notemos  que  el  caso  del  método  de  Newton  aplicado  a  la  función  f(z)  =  cos¿  se  puede 
reducir  al  caso  anterior.  Al  igual  que  los  ceros  de  la  función  eos  z  se  obtienen  aplicando  un 
desplazamiento  de  7í/2  a  los  ceros  de  la  función  sen^;,  las  cuencas  de  atracción  del  método 
de  Newton  aplicado  a  la  función  f(z)  =  cosz  son  un  desplazamiento  de  7t/2  respecto  a  las 
del  método  de  Newton  aplicado  a  la  función  f(z)  =  sen  z.  Así,  si  denotamos  s(z)  y  c(z) 
a  las  funciones  de  iteración  del  método  de  Newton  aplicado  a  las  funciones  f(z)  =  sen  z  y 
f(z)  =  cosz  respectivamente,  tenemos  que  s(z)  =  z  —  tgz  y  c(z)  =  z  —  cotz.  Entonces, 

c(z  +  7t/2)  =  s(z)  +  7t/2. 

En  el  caso  de  la  función  exponencial  f(z)  =  ez  —  1,  nos  encontramos  también  con  infinitas 
raíces  de  la  forma  z  =  2kni.  En  detalle  de  las  cuencas  de  atracción  del  método  de  Newton 
aplicado  a  esta  función,  Nf(z)  =  z  —  1  +  e~z,  puede  verse  en  la  figura  4.17.  Notemos  que 
aparece  una  gran  zona  en  negro  formada  por  puntos  de  partida  para  los  cuales  no  se  produce  la 
convergencia  ninguna  de  las  raíces.  La  aparición  de  tales  zonas  negras  puede  estar  provocada 
por  el  carácter  de  punto  fijo  indiferente  que  tiene  el  punto  del  infinito  en  este  caso. 
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Figura  4.17:  Cuencas  de  atracción  del  método  de  Newton  aplicado  a  la  función  exponencial 
f(z)  =  ez  -1. 


Capítulo  5 

Conjuntos  de  Julia  para  polinomios, 
conjunto  de  Mandelbrot  y  método  de 
Newton 

5.1.  Resultados  generales  sobre  iteración  de  polinomios 

En  otras  secciones  de  este  texto  nos  hemos  dedicado  al  estudio  de  las  iteraciones  de 
funciones  racionales,  tanto  en  el  campo  real  como  en  el  complejo.  Queremos  terminar  este 
libro  comentando  algunos  aspectos  del  comportamiento  dinámico  de  un  tipo  concreto  de 
funciones  racionales,  como  son  las  funciones  polinomiales.  Sin  duda,  el  caso  de  la  iteración 
de  polinomios  ha  sido  el  más  ampliamente  estudiado  (véase  [16],  [26],  [49],  [73]  o  [103],  por 
ejemplo).  En  particular,  la  iteración  de  la  familia  cuadrática  pc(z)  =  z2  +  c  con  c  G  C,  que  da 
lugar  al  famoso  conjunto  de  Mandelbrot,  puede  considerarse  como  la  referencia  básica  de  este 
tipo  de  problemas.  Una  introducción  asequible  al  conjunto  de  Mandelbrot  u  otras  estructuras 
fractales  puede  verse  en  [53],  [60]  o  [93]. 

En  esta  sección  veremos  algunos  resultados  correspondientes  a  la  dinámica  de  las  itera¬ 
ciones  de  esta  clase  particular  de  funciones  racionales.  Recordemos  que  estamos  trabajando 
en  el  plano  complejo  extendido  C  =  C  U  {oo}. 

Para  las  iteraciones  de  polinomios,  el  punto  z  —  oo  tiene  un  carácter  especial.  Sea 

p{z)  =  Qjclz d  +  a,d—izd  +  •  •  •  +  aiz  +  a0,  cid  0, 

un  polinomio  de  grado  d  >  2. 

Denotemos  por  C\  =  C¡  (p)  el  conjunto  de  puntos  críticos  del  polinomio  p.  Como  veremos 
más  adelante,  este  conjunto  determina  la  topología  de  J{p). 

Teorema  5.1.  Sea  p  un  polinomio  de  grado  d  >  2,  entonces 

1)  z  =  00  es  un  punto  fijo  atractor; 
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2)  z  —  oo  es  un  punto  crítico  de  orden  d  —  1; 

3)  B(oo)*  =  B( oo),  donde  B(oo)*  denota  la  componente  conexa  de  13 (oo)  que  contiene  a 
oo,  es  decir,  su  cuenca  de  atracción  inmediata. 

El  hecho  que  z  =  oo  es  un  punto  fijo  atractor  de  un  polinomio,  implica  la  siguiente 
definición. 

Definición  5.1.  Se  define  el  conjunto  de  Julia  lleno  de  p  como  el  conjunto 

K(p)  =  {z  G  C  :  { pn(z )  :  n  G  N}  está  acotado }  =  {z  G  C  :  pn(z )  oo}.  (5.1) 

En  otras  palabras,  JC(p)  =  C  —  13 (oo),  y  su  conjunto  de  Julia  es 

J(p)  =  dlC(p)  =  d(C-B(  oo)).  (5.2) 

Es  claro  que  B( oo)  y  JC(p)  son  invariantes,  y  en  consecuencia  J(p)  también  lo  es. 

Corolario  5.2.  El  conjunto  de  Julia  J(p)  de  p  está  acotado.  En  particular,  J(p)  no  tiene 
puntos  interiores. 

Teorema  5.3.  El  conjunto  de  Julia  J(p)  es  conexo  si  y  sólo  si  B( oo)  D  Cj  —  0.  Equivalen¬ 
temente,  todos  los  puntos  críticos  tienen  sus  órbitas  acotadas. 

Corolario  5.4.  Si  Cj  C  JC(p),  entonces  J(p)  es  conexo,  y  B( oo)  es  simplemente  conexo. 

Recordemos  que  un  conjunto  B  C  C  tiene  medida  de  Lebesgue  nula,  y  escribimos 
med(B)  =  0  si,  para  cada  £  >  0  dado,  es  posible  obtener  una  sucesión  de  cuadrados  abiertos 
(cerrados)  Q i,  Q2, . . . ,  Qi, . . .,  tales  que 

OO  OO 

B  C  Lie*  y  £  área(Q¿)  <  £■ 

i=  1  Í=  1 

El  siguiente  teorema  nos  dice  que  bajo  ciertas  condiciones  el  conjunto  de  Julia,  es  compu- 
tacionalmente  despreciable. 

Teorema  5.5.  Si  p(z)  es  un  polinomio  tal  que  Cj  C  B( 00),  entonces 

(a)  J(p )  es  totalmente  disconexo; 

(b)  J(p)  tiene  medida  de  Lebesgue  nula  en  C. 

La  condición  del  teorema  nos  dice  que  los  iterados  de  los  puntos  críticos  de  p  deben 
converger  a  00.  Esto  es  fácil  de  detectar  computacionalmente,  basta  calcular  los  módulos 
de  las  sucesivas  iteraciones  de  los  puntos  críticos  y  ver  qne  ellos  van  creciendo  en  forma 
indefinida. 


5.2.  Conjunto  de  Mandelbrot 
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5.2.  Conjunto  de  Mandelbrot 

El  caso  de  polinomios  cuadráticos  es  particularmente  interesante  por  la  propiedad  de 
dicotomía  que  posee  el  conjunto  de  Julia. 

Dado  un  polinomio  cuadrático  p(z)  =  Az2  +  Bz  +  C,  este  tiene  un  único  punto  crítico, 
cp.  Por  lo  tanto,  por  el  teorema  5.3  se  tiene  que 

Teorema  5.6.  J{p)  es  conexo  si  y  sólo  si  cp  G  JC(p).  Además,  si  cp  £  K.c,  entonces  J(p)  es 
totalmente  disconexo,  de  hecho  un  conjunto  de  Cantor. 

Por  otra  parte,  vimos  que  existe  una  conjugación  afín  <p(z)  =  az  +  ¡3  de  modo  que 
p  o  p  o  Lp~l  =  pc,  donde  pc(z)  =  z2  +  c,  para  algún  c  G  C.  Por  lo  tanto,  para  estudiar  la 
dinámica  de  los  polinomios  cuadráticos  es  suficiente  estudiar  la  dinámica  de  los  polinomios 
pc ,  con  c  G  C. 

Usando  la  dicotomía  dada  en  el  teorema  5.6,  y  el  hecho  que  cada  polinomio  cuadrático 
tiene  su  dinámica  representada  por  algún  elemento  de  la  familia  cuadrática  a  paramétrica 
pc(z)  =  z2  +  c,  se  define  el  conjunto  de  Mandelbrot  de  pc  como 

Ai  =  {c  G  C  :  J(pc)  es  conexo}.  (5.3) 

Esta  es  una  definición  basada  en  la  topología  del  conjunto  de  Julia  J (pc),  el  cual  denota¬ 
mos  simplemente  por  Jc.  Para  que  esta  definición  tenga  un  carácter  más  amigable,  veamos 
bajo  que  condiciones  el  único  punto  crítico  (finito)  z  —  0  del  pc  pertenece  al  conjunto  de  Julia 
lleno  /Cc. 

Tenemos  que  los  puntos  críticos  de  pc  son  dados  por  la  ecuación  p'c(z)  =  0,  ellos  son  z  —  0 
y  z  =  oo.  Ahora,  los  iterados  de  z  =  por  pc  son  dados  por  co  =  pc(0)  —  c,  c i  —  p2{ 0)  = 
Pc(Pc( 0))  =  c2  +  c,  c3  =  Pc(0)  —  PcÍpI(A))  =  (c2  +  c)2  +  c, . . .,  luego  0  G  /Cc  si  y  sólo  si  todos  sus 
iterados  permenecen  acotados,  por  lo  tanto,  tenemos  la  siguiente  caracterización  del  conjunto 
de  Mandelbrot 

Ai  =  (c  G  C  :  la  sucesión  (cn}n6pj  =  (Pc(0)}ne^  permanece  acotada} 

=  (c  G  C  :  cn  —  P™ (0)  oo}. 

Sobre  el  conjunto  de  Mandelbrot  se  tiene  bastante  información,  por  ejemplo,  Ai  es  conexo, 
compacto  y  C  —  Ai  es  conexo  (en  otras  palabras  es  un  conjunto  lleno)  [24],  Este  conjunto,  al 
igual  que  los  de  Julia  son,  en  general,  un  fractal.  La  generación  de  la  imagen  computacional 
del  conjunto  de  Maldelbrot  es  fácil  y  está  basada  en  su  propia  definición,  usando  el  algoritmo 
de  escape  al  infinito. 

El  plano  de  los  parámetros  c  G  C  es  donde  «vive»  el  conjunto  de  Mandelbrot,  el  cual 
es  de  hecho  un  catálogo  de  la  dinámica  de  polinomios  cuadráticos,  a  cada  valor  de  c  G  C 
le  corresponde  un  polinomio  pc(z)  =  z2  +  c  cuya  dinámica  deseamos  comprender.  Por  otra 
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Figura  5.1:  Benoit  Mandelbrot  (1924-2010)  y  el  conjunto  que  lleva  su  nombre. 

parte,  la  frontera  del  conjunto  de  Mandelbrot  corresponde  al  conjunto  de  parámetros  para 
los  cuales  ocurre  una  bifurcación,  esto  significa  un  cambio  cualitativo  de  la  dinámica  del 
polionmio,  o  en  otras  palabras,  si  A  es  una  componente  conexa  del  interior  del  conjunto 
de  Mandelbrot  y  ci,C2  €  A,  entonces  pCl  y  pC2  son  cuasiconformemente  equivalentes.  Esto 
significa  que  existe  un  homeomorfismo  cuasiconforme  p  :  C  — >  C  tal  que  (p  o  pci  =  pC2  o  p. 
Claro  está  nos  falta  definir  cuando  un  homeomorfismo  es  cuasiconforme.  Para  simplificar, 
suponemos  que  p  :  U  —>  V,  donde  V,  U  C  C  son  dominios  abiertos  es  un  difeomorfismo 
(derivable  con  inversa  derivable).  La  aplicación  M-lineal  Dp(z)  :  C  — >  C  lleva  círculos  en 
elipses,  sea  entonces  =  Dtp^z)^1),  definimos  el  coeficiente  de  dilatación  de  p  en  z,  el 
cual  denotamos  por  T>v(z),  como  el  cuociente  entre  la  longitud  del  eje  mayor  y  la  longitud 
del  eje  menor  E^z),  y  decimos  que  p  es  cuasiconforme  si  existe  una  constante  K  >  0  tal  que 

=  supjX^)  \  z  E  U}  <  K .  Para  la  definición  más  detallada  de  funciones  cuasiconformes 
ver  [45]. 

5.3.  Método  de  Newton  y  conjuntos  de  Julia 

Parece  ser  algo  sop rendente  que  los  conjuntos  de  Julia  llenos  de  polinomios  cuadráticos 
aparecen  como  parte  del  conjunto  de  Fatou  del  método  de  Newton  aplicado  a  polinomios 
cúbicos.  Esto  tiene  su  asidero  en  la  teoría  de  «funciones  de  tipo  polinómico»,  traducción 
adaptada  del  nombre  en  inglés  «polynomial-like  mappings»,  desarrollada  por  A.  Douady  y 
J.  Hubbard  en  [45]. 

Definición  5.2.  Una  función  de  tipo  polinómico  de  grado  d  >  2  es  una  terna  {f,U,V), 
donde  U  y  V  son  conjuntos  abiertos  de  C  isomorfos  a  discos  con  UdVyf:  U—>Ves 
una  aplicación  holomorfa,  tal  que  cada  punto  en  V  tiene  exactamente  d  preimágenes  en  U , 
cuando  ellas  son  contadas  con  sus  respectivas  multiplicidades. 


5.3.  Método  de  Newton  y  conjuntos  de  Julia 
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Ejemplos  obvios  de  tales  funciones  son  los  polinomios  de  grado  d  >  2  restringidos  a  un 
conjunto  abierto  suficientemente  grande. 

Cabe  notar  que  una  función  de  tipo  polinómico  de  grado  2  necesariamente  tiene  un  único 
punto  crítico  en  el  interior  de  U . 

Existen  ejemplos  de  polinomios  cúbicos  los  cuales  restringidos  a  un  conjunto  abierto  son 
funciones  de  tipo  polinómico  de  grado  2.  Para  ello  basta  considerar  un  polinomio  cúbico 
p(z )  con  un  punto  crítico  w±  escapando  al  infinito  por  iteraciones  bajo  p  mientras  que  las 
iteraciones  del  otro  punto  crítico  W2  permanecen  acotadas. 

El  conjunto  de  Julia  lleno  para  una  función  de  tipo  polinómico  se  define  de  modo  análogo 
al  conjunto  de  Julia  lleno  de  un  polinomio.  Esto  es,  si  /  :  V  — >  U  es  una  función  de  tipo 
polinómico,  el  conjunto  de  Julia  lleno  de  /  es 

/C(/)  =  {z  G  U  :  fn(z )  G  U  para  todo  n  >  1} 


o  equivalentemente 

«a)  =  n  /"“(c) 

n>  0 

y  su  conjunto  de  Julia  como 

J(f)  =  dlC(f). 

Sean  /,  g  :  C  — >  C,  si  en  la  ecuación  de  conjugación  h  o  f  —  g  o  h,  donde  h  :  C  — >  C  es 
ahora  una  función  cuasiconforme,  decimos  que  /  y  g  son  cuasiconformemente  conjugadas 
El  siguiente  resultado  nos  muestra  que  efectivamente,  una  función  de  tipo  polinómico  se 
comporta  como  un  polinomio. 

Teorema  5.7  (Douady  y  Hubbard,  [45]).  Sea  (f,U,V)  una  función  de  tipo  polinómico  de 
grado  2.  Entonces  existe  c  G  C,  tal  que  f  y  pc  son  cuasiconformemente  conjugadas  en  entornos 
de  sus  respectivos  conjuntos  de  Julia  llenos.  Además,  si  IC(f)  es  conexo,  entonces  tal  c  es 
único. 

En  particular,  se  deduce  de  este  teorema  que  los  conjuntos  de  Julia  llenos  JC(pc)  y  JC(f) 
son  homeomorfos,  y  más  aún,  son  cuasiconformemente  homeomorfos.  Esto  explica  porqué 
en  muchos  casos  aparecen  copias  (ligeramente  deformadas)  de  conjuntos  de  Julia  llenos  de 
funciones  cuadráticas  en  la  dinámica  de  otras  funciones.  Por  ejemplo,  en  la  figura  5.2  vemos 
aparecer  el  conocido  como  «conejo  de  Douady»  en  el  conjunto  de  Julia  del  método  de  Newton 
para  el  polinomio 

p(z)  =  z3  -  (A  -  l)z  -  A,  A  =  0.3597736432  +  0.003366617600b  (5.4) 

Si  consideramos  ahora  la  familia  de  polinomios 


pa(z)  =  z3  +  (a  —  2  )z2  —  az  +  a, 


(5.5) 
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Figura  5.3:  Cuencas  de  atracción  de  la  función  de  iteración  del  método  de  Newton,  NPa 
donde  pa  está  definido  en  (5.5)  y  una  ampliación  de  la  zona  central. 

Como  hemos  visto,  la  teoría  de  funciones  de  tipo  polinómico  explica  el  hecho  que  los 
conjuntos  de  Julia  de  polinomios  aparecen  en  los  conjuntos  de  Julia  de  otras  funciones.  Esto 


Figura  5.2:  El  «conejo  de  Douady»  en  el  conjunto  de  Julia  del  método  de  Newton  para  el 
polinomio  definido  en  (5.4).  La  figura  de  la  derecha  muestra  una  ampliación  cerca  del  origen. 

donde 

a  =  1/2(1  +  \/l  +  32/(4  -  £)),  i  =  -  +  ^-i, 

vemos  aparecer  los  conjuntos  que  se  muestran  en  la  figura  5.3.  A  la  derecha  se  representan 
las  cuencas  de  atracción  de  las  raíces  y  su  conjunto  de  Julia,  a  la  izquierda  una  ampliación 
de  la  región  central  en  negro. 


5.4.  El  f racial  de  Chicho 
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se  extiende  a  funciones  trascendentales,  como  puede  verse  en  las  figuras  5.4  y  5.5,  donde  se 
muestran  los  conjuntos  de  Julia  asociados  a  la  iteración  de  funciones  trigonométricas  (véase 
también  [87]  y  [137]). 


Figura  5.4:  Conjunto  de  Julia  de  F(z)  =  ai  sen  2  y  de  F(z)  =  «2  sen  2  donde  a\  =  1.88853  + 
0673125Í  y  a2  =  1  +  0.5i 


Figura  5.5:  Conjunto  de  Julia  de  F(z)  =  eos  2  y  de  F(z)  =  0.67ícos2. 


5.4.  El  fractal  de  Chicho 

No  nos  resistimos  a  terminar  estas  notas  sin  hacer  referencia  a  un  problema  especialmente 
querido  para  los  autores.  Se  trata  del  conocido  como  fractal  de  Chicho  y  está  estrechamente 
vinculado  con  el  contenido  de  esta  sección,  ya  que  puede  verse  como  una  modificación  del 
conjunto  de  Mandelbrot.  Su  representación  gráfica  y  algunas  de  sus  propiedades  matemáticas 
fueron  analizadas  en  [19],  una  publicación  contenida  en  un  libro  publicado  en  homenaje  a 
José  Javier  (Chicho)  Guadalupe  (1945-2000). 

La  idea  consiste  en  modificar  la  función  de  iteración  que  da  lugar  al  conjunto  de  Man¬ 
delbrot  de  la  siguiente  manera.  Para  pc(z)  =  z2  +  c,  con  z  =  x  +  iy  y  c  =  a  +  ib,  podemos 
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escribir  la  sucesión  de  puntos  {Pc(0)}n6N  en  forma  recursiva  de  la  siguiente  manera: 

Xn+1  =  X2n  -  yl  +  a,  yn+\  =  2 xnyn  +  b,  x0  =  y0  =  0.  (5.6) 

La  siguiente  variante  implícita  de  la  sucesión  (5.6)  fue  propuesta  por  el  propio  Chicho  y 
M.  Benito  en  [18]: 

xn+i  =  x2n  -  yl  +  a,  yn+1  =  2xn+1  yn  +  b,  x0  =  y0  =  0.  (5.7) 


La  sucesión  (5.7)  se  corresponde  con  la  órbita  del  punto  (0,0)  mediante  la  función  de 
iteración 

Tc(x,  y)  =  (x2  —  y2  +  a,  2(x2  —  y2  +  a)y  +  bj  ,  c  =  aj-ib.  (5.8) 

En  concreto  definimos  el  conjunto  de  Chicho  como  el  subconjunto  de  C  formado  por  los 
puntos  c  para  los  cuales  la  órbita  de  (0,  0)  por  Tc  está  acotada.  Denotamos  a  dicho  conjunto 
como  CU.  Su  representación  gráfica  puede  verse  en  la  figura  5.6. 


Figura  5.6:  Chicho  Guadalupe  y  el  fractal  que  lleva  su  nombre. 

Notemos  que  el  conjunto  de  Chicho  CU  puede  interpretarse  como  la  aplicación  de  un 
proceso  de  Gauss-Seidel  a  la  función  pc{z )  =  z2  +  c  de  la  que  resulta  el  conocido  conjunto  de 
Mandelbrot.  Las  consecuencias  que  desde  el  punto  de  vista  dinámico  tiene  este  proceso  de 
«gausseidelización»  no  son  en  absoluto  triviales. 

Así  por  ejemplo,  es  bien  conocido  [16]  que  el  conjunto  de  Mandelbrot  está  contenido  en 
el  disco  de  centro  el  origen  y  radio  2.  Sin  embargo,  no  se  ha  podido  probar  o  refutar  si  el 
conjunto  de  Chicho  está  acotado  o  no.  Algunos  resultados  parciales  a  este  respecto  pueden 
verse  en  [19].  En  concreto,  se  tiene  que: 

1.  Cuando  c  G  R,  la  sucesión  {un}n6N  =  {^T(0)}neN  es  una  sucesión  de  números  reales 
que  resulta  ser  la  misma  que  la  definida  por  pc  para  c  G  R.  Por  tanto,  (un)neN  está 
acotada  si  y  sólo  si 


1 

-2  <  c  <  -. 
~  “4 
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2.  El  conjunto  de  puntos  c  =  a  +  bi  G  C  para  los  cuales  la  función  Tc  definida  en  (5.8) 
tiene  un  punto  fijo  atractor  se  sitúa  en  el  interior  de  la  curva 

(r2  —  2 )r  eos  29  —  2 r  —  r3  +  8  eos  9 

/ -  (5.9) 

=  r|  sen  9\  y  2(8  +  4r2  +  r4  —  16r  cosd  —  r2(r2  —  4)  cos2ú), 

donde  a  =  (1  —  r2cos2ú)/4  y  b  =  (r2sen2ú)/4.  La  gráfica  de  la  función  definida  de 
forma  implícita  en  (5.9)  es  la  curva  en  forma  de  corazón  que  se  muestra  en  la  figura  5.7. 
El  conjunto  de  puntos  c  =  a+ib  para  los  cuales  la  función  Tc  tiene  un  punto  fijo  atractor 
se  sitúa  en  el  interior  de  dicho  corazón. 


Figura  5.7:  Región  donde  Tc  definida  en  (5.8)  tiene  un  punto  fijo  atractor. 

A  continuación  podríamos  proceder  a  estudiar  los  puntos  fijos  de  T2  para  caracterizar  las 
órbitas  que  convergen  a  un  2-ciclo  y  así  sucesivamente.  Sin  embargo,  esto  resulta  extrema¬ 
damente  complejo,  por  lo  que  nos  conformamos  con  contemplar  el  aspecto  que  presenta  el 
conjunto  de  Chicho  que  se  muestra  en  la  figura  5.6,  donde  están  representados  todos  aquellos 
puntos  para  los  cuales  la  órbita  de  0  por  Tc  se  encuentra  en  el  disco  de  centro  el  origen  y 
radio  2  después  de  un  número  prefijado  de  iteraciones. 

El  proceso  de  «gausseidelización»  aplicado  en  el  conjunto  de  Chicho  se  puede  aplicar  a 
otras  funciones  de  iteración,  distintas  del  polinomio  pc(z)  =  z2  +  c,  tal  y  como  se  hace  en  [59]. 
Desde  un  punto  de  vista  computacional,  puede  parecer  que  la  «gausseidelización»  es  una 
clara  mejora  en  la  eficiencia  y  en  la  velocidad  de  convergencia  de  un  proceso,  ya  que  para  el 
cálculo  de  yn+i  se  emplea  la  actualización  xn+\  en  vez  de  xn.  Sin  embargo,  esta  afirmación 
necesita  de  una  prueba  rigurosa  que  establezca  bajo  que  condiciones  es  cierta.  Del  mismo 
modo  que  se  sabe  que  para  resolver  sistemas  de  ecuaciones  lineales  el  método  iterativo  de 
Gauss-Seidel  no  siempre  es  más  rápido  que  el  método  de  Jacobi,  habría  que  determinar  bajo 
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que  condiciones  la  «gausseidelización»  de  un  proceso  iterativo  da  lugar  efectivamente  a  una 
mejora  computacional. 

Por  último,  en  [59]  también  se  pone  de  manifiesto  que  la  «gausseidelización»  de  un  pro¬ 
ceso  iterativo  tiene  una  clara  influencia  en  la  forma  de  las  cuencas  de  atracción  asociadas  a 
los  puntos  fijos  del  proceso.  En  concreto,  en  dicho  artículo  se  presentan  unos  experimentos 
numéricos  que  sugieren  que  la  «gausseidelización»  tiene  el  efecto  de  disminuir  la  dimensión 
fractal  de  los  conjuntos  de  Julia  asociados  a  las  citadas  cuencas  de  atracción.  De  una  ma¬ 
nera  coloquial,  podríamos  decir  que  dichos  conjuntos  de  Julia  tienen  una  apariencia  menos 
intrincada.  Pero,  hasta  donde  nosotros  conocemos,  éste  es  un  problema  abierto  que  está  a  la 
espera  de  su  solución. 
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